面向内容大数据的小样本关系抽取方法和装置
基本信息
申请号 | CN202110706996.8 | 申请日 | - |
公开(公告)号 | CN113378573A | 公开(公告)日 | 2021-09-10 |
申请公布号 | CN113378573A | 申请公布日 | 2021-09-10 |
分类号 | G06F40/295(2020.01)I;G06F40/284(2020.01)I;G06F40/216(2020.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 杨鹏;娄健;程昌虎;张磊宏 | 申请(专利权)人 | 北京华成智云软件股份有限公司 |
代理机构 | 南京众联专利代理有限公司 | 代理人 | 叶涓涓 |
地址 | 100070北京市丰台区南四环西路128号院1号楼5层526 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种面向内容大数据的小样本关系抽取方法和装置。本发明首先利用预训练语言模型和字符级LSTM对句子进行向量化处理;其次通过双仿射机制和图神经网络提取文本结构特征;同时使用单词级LSTM和BERT中表示语义信息的[CLS]词向量将上下文语境信息融入实体对的词向量,构造含语境信息的实体对特征;最后通过相似‑差异关系网络提取句子特征的相似性和差异性进行小样本关系抽取。本发明在内容大数据场景下应用小样本学习,充分地提取了文本特征,并刻画了不同类别实体关系间的差异性,提高了关系抽取的准确率。 |
