一种文本特征抽取方法及知识图谱构建方法

基本信息

申请号 CN202110958984.4 申请日 -
公开(公告)号 CN113656556A 公开(公告)日 2021-11-16
申请公布号 CN113656556A 申请公布日 2021-11-16
分类号 G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06F40/166(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 曾祥云;朱姬渊 申请(专利权)人 上海易康源医疗健康科技有限公司
代理机构 上海硕力知识产权代理事务所(普通合伙) 代理人 杨松城
地址 200120 上海市浦东新区中国(上海)自由贸易试验区临港新片区新杨公路860号10幢
法律状态 -

摘要

摘要 本发明公开一种文本特征抽取方法及知识图谱构建方法,其文本特征抽取方法以标注好的实体和关系为正样本作为基础构建负样本:实体负样本,关系负样本和指代消歧负样本;对正样本和负样本进行映射表征,得到实体表征,实体对表征和指代消歧实体对表征构成的向量集;对向量集进行分析,获取实体特征、指代消歧特征以及关系特征;对实体特征、指代消歧特征以及关系特征进行分类;设置损失函数,对分类结果进行评价,本发明以实体为中心,并辅以指代消歧,解决了因为指代词非实体造成的实体丢失情况,提升了模型整体的准确性,并融合关系特征,进一步提升关系识别的准确率。