文本实体关系抽取方法、装置及计算机可读存储介质设备

基本信息

申请号 CN202010693018.X 申请日 -
公开(公告)号 CN111881256A 公开(公告)日 2020-11-03
申请公布号 CN111881256A 申请公布日 2020-11-03
分类号 G06F16/33(2019.01)I 分类 计算;推算;计数;
发明人 胡浩;张玉臣;周洪伟;何淼;朱红涛 申请(专利权)人 河南金明源信息技术有限公司
代理机构 郑州大通专利商标代理有限公司 代理人 周艳巧
地址 450000河南省郑州市高新区科学大道62号
法律状态 -

摘要

摘要 本发明属于自然语言处理技术领域,特别涉及一种文本实体关系抽取方法、装置及计算机可读存储介质设备,该方法包含:针对输入文本,通过将单词获取词向量表示,以获取其中实体对语句特征;利用点互信息PMI计算实体对关系之间相似度,并通过相似度得到类关系;通过类关系查找实体关系之间隐含内容。本发明考虑实体关系之间的隐含语义,基于点互信息PMI计算实体关系之间的相似度,不需要对训练文本中的实体关系进行人工标注,从而可以快速抽取实体关系,可以对隐含关系进行有效抽取,利用相似度对抽取关系进行归并和精简,实现对噪声数据的过滤,使关系抽取更加精确,提升关系抽取的准确率和召回率,便于实际场景应用。