一种基于企业关联关系的人名消歧方法及系统

基本信息

申请号 CN202110616330.3 申请日 -
公开(公告)号 CN113326377A 公开(公告)日 2021-08-31
申请公布号 CN113326377A 申请公布日 2021-08-31
分类号 G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06N20/00(2019.01)I 分类 计算;推算;计数;
发明人 丁凯;尹杰;张彬;郭丰俊;龙腾;镇立新 申请(专利权)人 上海生腾数据科技有限公司
代理机构 上海双霆知识产权代理事务所(普通合伙) 代理人 殷晓雪
地址 200436上海市静安区万荣路1256、1258号1101室
法律状态 -

摘要

摘要 本申请公开了一种基于企业关联关系的人名消歧方法。构建反映企业关联关系的知识图谱。将知识图谱划分为一个或多个连通子图。根据查询时输入的人名以及企业名,在各连通子图中查找查询输入企业节点;在具有查询输入企业节点的连通子图中生成查询输入个人节点;在该连通子图中,寻找查询输入个人节点的所有同名个人节点,将路径最短的前k个样本输入预定义或已训练好的判别模型,得到唯一候选同名节点对。若判别模型输出的唯一的候选同名节点对的预测值大于某阈值,则判定该候选同名节点对中的两个同名的个人节点为同一自然人。本申请使用多种不同策略方法对目标同名个人节点对进行人名消歧。