一种基于预训练模型的级联二进制中文实体关系提取方法

基本信息

申请号 CN202110802863.0 申请日 -
公开(公告)号 CN113626553A 公开(公告)日 2021-11-09
申请公布号 CN113626553A 申请公布日 2021-11-09
分类号 G06F16/31(2019.01)I;G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/295(2020.01)I;G06F40/30(2020.01)I 分类 计算;推算;计数;
发明人 刘晓明;朱皓宬;沈超;周亚东;郭俊波 申请(专利权)人 人民网股份有限公司
代理机构 西安智大知识产权代理事务所 代理人 段俊涛
地址 100035北京市西城区新街口外大街28号B座234号
法律状态 -

摘要

摘要 一种基于预训练模型的级联二进制中文实体关系提取方法,包括:利用预训练模型Bert将文本的语义及位置信息提取联合生成嵌入向量;将关系建模为主体到客体的一种函数映射,抛弃了以往主客体同时识别的方式,首先通过对每个字的嵌入向量进行二分类任务预测三元组中主体所在的位置,然后在提取关系及客体的过程中,将文本及主体的联合嵌入信息作为输入,在每种关系映射之下对每个字的嵌入向量进行二分类任务预测三元组中客体所在的位置。本发明能够提取出非结构化文本的人物,组织,事件等实体及其之间的多种关系并有效的解决了三元组之间的重叠问题,预测结果准确率高、误差小,计算复杂度低,有很高的实用价值。