基于hash存储的网络词汇语义分析方法和系统
基本信息
申请号 | CN201810917995.6 | 申请日 | - |
公开(公告)号 | CN109145297B | 公开(公告)日 | 2022-06-10 |
申请公布号 | CN109145297B | 申请公布日 | 2022-06-10 |
分类号 | G06F40/30(2020.01)I;G06F16/901(2019.01)I;G06F16/13(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 张楠;谢彬;李程;刘立;佘平 | 申请(专利权)人 | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) |
代理机构 | 上海段和段律师事务所 | 代理人 | - |
地址 | 201800上海市嘉定区嘉罗路1485号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于Hash存储的网络词汇语义分析方法和系统,收集网络词汇,对所收集的网络词汇,收集对应的传统词汇,依据所述网络词汇、传统词汇的一一对应关系建立(key,value)对,其中key为网络词汇,value为传统词汇;确定Hash函数,将所述(key,value)对根据Hash函数计算得出Hash函数值,按所述Hash函数值、所述(key,value)对存储在Hash链表中;在Hash链表中查找所述网络词汇,并转化为传统词汇;依据上下文的语义结构,结合贝叶斯定律,修正词汇语义的二义性,判定所述词汇是否是网络词汇。针对社交短文本中存在的大量网络用语现象,快速准确定位社交短文本中的网络用语。 |
