一种中文实体关系联合抽取方法

基本信息

申请号 CN202110397595.9 申请日 -
公开(公告)号 CN113128229A 公开(公告)日 2021-07-16
申请公布号 CN113128229A 申请公布日 2021-07-16
分类号 G06F40/295(2020.01)I;G06N3/04(2006.01)I 分类 计算;推算;计数;
发明人 沈光熠;杨志勇 申请(专利权)人 南京瑞拷得智慧信息科技有限公司
代理机构 南京千语知识产权代理事务所(普通合伙) 代理人 尚于杰;祁文彦
地址 210000江苏省南京市鼓楼区西康路1号
法律状态 -

摘要

摘要 本发明提供了一种中文实体关系联合抽取方法,包括使用bert模型学习字符向量,字符向量拼接字形特征及字符位置信息;使用双向LSTM模型学习字符特征;使用选择性注意力机制进行实体识别;使用层次注意力机制LSTM进行关系抽取方法。本申请通过底层共享网络参数的方式,进行联合知识抽取,解决抽取中实体识别和关系抽取错误累计的问题;通过引入分词与词表向量,在词向量中拼接中文特征,解决中文特征信息不充分的问题;通过在结合自注意力机制的双向LSTM编码层,对长距离序列进行建模;通过层级注意力机制,解决实体关系之间关联不足的问题。