一种基于卷积神经网络和距离监督的关系抽取方法
基本信息
申请号 | CN201610393749.6 | 申请日 | - |
公开(公告)号 | CN106055675B | 公开(公告)日 | 2019-10-29 |
申请公布号 | CN106055675B | 申请公布日 | 2019-10-29 |
分类号 | G06F16/9535;G06F17/27;G06N3/02 | 分类 | 计算;推算;计数; |
发明人 | 凌立刚;朱海鹏 | 申请(专利权)人 | 杭州量知数据科技有限公司 |
代理机构 | 杭州求是专利事务所有限公司 | 代理人 | 杭州量知数据科技有限公司 |
地址 | 310013 浙江省杭州市西湖区西溪路525号C楼492室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于卷积神经网络和距离监督的关系抽取方法。包括如下步骤:(1)将已有的少量关系映射成所需要的关系类型;(2)扩展已有的关系中实体的不同表达方式;(3)从互联网上获取大量相关的非结构化文本,并建立索引;(4)通过索引查询与实体相关的句子,并分出正负样本;(5)基于卷积神经网络,将样本转换为特征向量;(6)利用获取的特征向量,对文本进行分类,得到新的关系对。本发明基于一个句子可能存在一种关系的假设,从少量的已知关系开始,利用大量来自互联网的非结构化文本,获取得到大量新的结构化信息,也就是发现新的关系。 |
