一种基于卷积神经网络和距离监督的关系抽取方法

基本信息

申请号 CN201610393749.6 申请日 -
公开(公告)号 CN106055675B 公开(公告)日 2019-10-29
申请公布号 CN106055675B 申请公布日 2019-10-29
分类号 G06F16/9535;G06F17/27;G06N3/02 分类 计算;推算;计数;
发明人 凌立刚;朱海鹏 申请(专利权)人 杭州量知数据科技有限公司
代理机构 杭州求是专利事务所有限公司 代理人 杭州量知数据科技有限公司
地址 310013 浙江省杭州市西湖区西溪路525号C楼492室
法律状态 -

摘要

摘要 本发明公开了一种基于卷积神经网络和距离监督的关系抽取方法。包括如下步骤:(1)将已有的少量关系映射成所需要的关系类型;(2)扩展已有的关系中实体的不同表达方式;(3)从互联网上获取大量相关的非结构化文本,并建立索引;(4)通过索引查询与实体相关的句子,并分出正负样本;(5)基于卷积神经网络,将样本转换为特征向量;(6)利用获取的特征向量,对文本进行分类,得到新的关系对。本发明基于一个句子可能存在一种关系的假设,从少量的已知关系开始,利用大量来自互联网的非结构化文本,获取得到大量新的结构化信息,也就是发现新的关系。