一种融合句子局部上下文与文档领域信息的词义消歧方法

基本信息

申请号 CN201610033097.5 申请日 -
公开(公告)号 CN105740225B 公开(公告)日 2019-02-01
申请公布号 CN105740225B 申请公布日 2019-02-01
分类号 G06F17/27 分类 计算;推算;计数;
发明人 鹿文鹏;孟凡擎;杜月寒 申请(专利权)人 山东经伟晟睿数据技术有限公司
代理机构 济南信达专利事务所有限公司 代理人 孙园园
地址 250001 山东省济南市高新区新泺大街2008号银荷大厦C座1002室
法律状态 -

摘要

摘要 本发明涉及一种融合句子局部上下文与文档领域信息的词义消歧方法,属于自然语言处理技术领域。其步骤为:①对歧义词所在的句子进行依存句法分析,获得与歧义词具有直接依存关系的句子局部上下文相关词;②对领域文档集合进行依存句法分析,收集其所包含的全部的依存元组,构建依存元组库;③对依存元组库进行统计分析,找到与歧义词关系最为密切的一组领域相关词;④根据领域相关词的依存分布相似度及其与局部上下文的词义相关度,确定其消歧权重;⑤将句子局部上下文相关词和领域相关词合并,构建相关词集合;⑥根据歧义词的各个词义与相关词集合的加权累加相关度,判定正确词义。本发明公开的方法能够提高词义消歧系统在特定领域上的适应性,提高消歧正确率。