一种自然语言文本关键词关联网络构建方法
基本信息
申请号 | CN201410719639.5 | 申请日 | - |
公开(公告)号 | CN104391963A | 公开(公告)日 | 2015-03-04 |
申请公布号 | CN104391963A | 申请公布日 | 2015-03-04 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 郭光 | 申请(专利权)人 | 北京中科创益科技有限公司 |
代理机构 | 北京风雅颂专利代理有限公司 | 代理人 | 李弘;李翔 |
地址 | 100055 北京市西城区南滨河路甲25号金工宏洋大厦B座301 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种自然语言文本关键词关联网络构建方法,包括步骤:构建关键词的词典,根据所述词典对目标语料库进行分词操作,得到多个词;对得到的多个词基于N元统计语言模型统计前后词关联出现的频度;以统计出的频度为训练条件,采用神经网络训练语言模型,并获得词向量;计算两个词的词向量的相似度,作为两个词语义相关性的度量,生成两个词之间语义关联度;根据所述语义关联度,按照两个词之间的所述语义关联度的高低,生成文本关键词关联网络。该方法,能够有效地提高有关项目中文本关联网络的精确度。 |
