基于hash存储的网络词汇语义分析方法和系统

基本信息

申请号 CN201810917995.6 申请日 -
公开(公告)号 CN109145297B 公开(公告)日 2022-06-10
申请公布号 CN109145297B 申请公布日 2022-06-10
分类号 G06F40/30(2020.01)I;G06F16/901(2019.01)I;G06F16/13(2019.01)I 分类 计算;推算;计数;
发明人 张楠;谢彬;李程;刘立;佘平 申请(专利权)人 华东计算技术研究所(中国电子科技集团公司第三十二研究所)
代理机构 上海段和段律师事务所 代理人 -
地址 201800上海市嘉定区嘉罗路1485号
法律状态 -

摘要

摘要 本发明提供了一种基于Hash存储的网络词汇语义分析方法和系统,收集网络词汇,对所收集的网络词汇,收集对应的传统词汇,依据所述网络词汇、传统词汇的一一对应关系建立(key,value)对,其中key为网络词汇,value为传统词汇;确定Hash函数,将所述(key,value)对根据Hash函数计算得出Hash函数值,按所述Hash函数值、所述(key,value)对存储在Hash链表中;在Hash链表中查找所述网络词汇,并转化为传统词汇;依据上下文的语义结构,结合贝叶斯定律,修正词汇语义的二义性,判定所述词汇是否是网络词汇。针对社交短文本中存在的大量网络用语现象,快速准确定位社交短文本中的网络用语。