一种基于图模型和词向量相结合的词义消歧方法及装置

基本信息

申请号 CN202011063422.5 申请日 -
公开(公告)号 CN112214999A 公开(公告)日 2021-01-12
申请公布号 CN112214999A 申请公布日 2021-01-12
分类号 G06F40/284(2020.01)I 分类 计算;推算;计数;
发明人 杜永兴;牛丽静;李宝山;胡伟健;李灵芳;周李涌 申请(专利权)人 内蒙古智牧溯源技术开发有限公司
代理机构 黑龙江立超同创知识产权代理有限责任公司 代理人 王大为
地址 014010内蒙古自治区包头市昆区阿尔丁大街7号
法律状态 -

摘要

摘要 一种基于图模型和词向量相结合的词义消歧方法及装置,属于自然语言处理领域,用以解决现有的词义消歧方法准确率不高的问题。本发明的技术要点包括,对数据集进行预处理,获取歧义词;构建图模型,并根据图模型获取上下文背景知识;训练词向量模型,并根据词向量模型对获取的歧义词和上下文背景知识进行词向量表示;将以词向量表示的歧义词和上下文背景知识进行交叉加权相似度计算并取均值,将相似度均值最高的确定为歧义词的正确义项。本发明通过将图模型和词向量结合,提高了词义消歧的正确率,取得了较好的消歧效果。本发明优于传统词义消歧方法,可以很好的满足实际应用的需求。