一种中文实体关系联合抽取方法
基本信息
申请号 | CN202110397595.9 | 申请日 | - |
公开(公告)号 | CN113128229A | 公开(公告)日 | 2021-07-16 |
申请公布号 | CN113128229A | 申请公布日 | 2021-07-16 |
分类号 | G06F40/295(2020.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 沈光熠;杨志勇 | 申请(专利权)人 | 南京瑞拷得智慧信息科技有限公司 |
代理机构 | 南京千语知识产权代理事务所(普通合伙) | 代理人 | 尚于杰;祁文彦 |
地址 | 210000江苏省南京市鼓楼区西康路1号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种中文实体关系联合抽取方法,包括使用bert模型学习字符向量,字符向量拼接字形特征及字符位置信息;使用双向LSTM模型学习字符特征;使用选择性注意力机制进行实体识别;使用层次注意力机制LSTM进行关系抽取方法。本申请通过底层共享网络参数的方式,进行联合知识抽取,解决抽取中实体识别和关系抽取错误累计的问题;通过引入分词与词表向量,在词向量中拼接中文特征,解决中文特征信息不充分的问题;通过在结合自注意力机制的双向LSTM编码层,对长距离序列进行建模;通过层级注意力机制,解决实体关系之间关联不足的问题。 |
