面向内容大数据的小样本关系抽取方法和装置

基本信息

申请号 CN202110706996.8 申请日 -
公开(公告)号 CN113378573A 公开(公告)日 2021-09-10
申请公布号 CN113378573A 申请公布日 2021-09-10
分类号 G06F40/295(2020.01)I;G06F40/284(2020.01)I;G06F40/216(2020.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I 分类 计算;推算;计数;
发明人 杨鹏;娄健;程昌虎;张磊宏 申请(专利权)人 北京华成智云软件股份有限公司
代理机构 南京众联专利代理有限公司 代理人 叶涓涓
地址 100070北京市丰台区南四环西路128号院1号楼5层526
法律状态 -

摘要

摘要 本发明公开了一种面向内容大数据的小样本关系抽取方法和装置。本发明首先利用预训练语言模型和字符级LSTM对句子进行向量化处理;其次通过双仿射机制和图神经网络提取文本结构特征;同时使用单词级LSTM和BERT中表示语义信息的[CLS]词向量将上下文语境信息融入实体对的词向量,构造含语境信息的实体对特征;最后通过相似‑差异关系网络提取句子特征的相似性和差异性进行小样本关系抽取。本发明在内容大数据场景下应用小样本学习,充分地提取了文本特征,并刻画了不同类别实体关系间的差异性,提高了关系抽取的准确率。