一种基于多数据源的知识图谱人物实体对齐方法
基本信息
申请号 | CN201810385484.4 | 申请日 | - |
公开(公告)号 | CN108717425A | 公开(公告)日 | 2018-10-30 |
申请公布号 | CN108717425A | 申请公布日 | 2018-10-30 |
分类号 | G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 刘前卫;盛兴;赵焱;刘广峰;张渝;张涛;周莉;聂庆;谢秋学;雍志娟;贺芳;孙金;吴培培;滕家雨;张楠;商莹楠;王光林;刘斌;季笑庆;张婷婷 | 申请(专利权)人 | 英大传媒投资集团有限公司 |
代理机构 | 南京苏高专利商标事务所(普通合伙) | 代理人 | 国家电网公司;英大传媒投资集团有限公司;南瑞集团有限公司;国网山东省电力公司烟台供电公司 |
地址 | 100031 北京市西城区西长安街86号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于多数据源的知识图谱人物实体对齐方法,该方法首先从知识图谱中将同名的人物实体规约在一起,然后对两个及以上相同名字的实体相互之间进行比较,计算两者之间相似度,设置相应的阈值区间[a,b],相似度大于b则判断是相同的实体,如果相似度大于a而小于b则加入到人工确认合并候选集,由人工进行确认,如果相似度小于a,则直接判定为不同实体。本发明在本体信息不完备的情形下进行人物实体合并,通过利用百科知识库、基于共同发文网络关系和研究领域相似度的方法进行加权求和,最后综合判断,且加权参数根据机器学习的结果实时更新,机器自主学习,让结果更加精准。 |
