文本实体关系抽取方法、装置及计算机可读存储介质设备
基本信息
申请号 | CN202010693018.X | 申请日 | - |
公开(公告)号 | CN111881256A | 公开(公告)日 | 2020-11-03 |
申请公布号 | CN111881256A | 申请公布日 | 2020-11-03 |
分类号 | G06F16/33(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 胡浩;张玉臣;周洪伟;何淼;朱红涛 | 申请(专利权)人 | 河南金明源信息技术有限公司 |
代理机构 | 郑州大通专利商标代理有限公司 | 代理人 | 周艳巧 |
地址 | 450000河南省郑州市高新区科学大道62号 | ||
法律状态 | - |
摘要
摘要 | 本发明属于自然语言处理技术领域,特别涉及一种文本实体关系抽取方法、装置及计算机可读存储介质设备,该方法包含:针对输入文本,通过将单词获取词向量表示,以获取其中实体对语句特征;利用点互信息PMI计算实体对关系之间相似度,并通过相似度得到类关系;通过类关系查找实体关系之间隐含内容。本发明考虑实体关系之间的隐含语义,基于点互信息PMI计算实体关系之间的相似度,不需要对训练文本中的实体关系进行人工标注,从而可以快速抽取实体关系,可以对隐含关系进行有效抽取,利用相似度对抽取关系进行归并和精简,实现对噪声数据的过滤,使关系抽取更加精确,提升关系抽取的准确率和召回率,便于实际场景应用。 |
