基于知识图谱的字段级的数据血缘确定方法及装置
基本信息
申请号 | CN202011626496.5 | 申请日 | - |
公开(公告)号 | CN112711591B | 公开(公告)日 | 2021-10-08 |
申请公布号 | CN112711591B | 申请公布日 | 2021-10-08 |
分类号 | G06F16/22;G06F16/36;G06K9/62 | 分类 | 计算;推算;计数; |
发明人 | 雷涛;乔旺龙;赵琳;曹晓磊 | 申请(专利权)人 | 天云融创数据科技(北京)有限公司 |
代理机构 | 北京开阳星知识产权代理有限公司 | 代理人 | 安伟 |
地址 | 100025 北京市朝阳区东四环中路78号大成国际中心A1座9A08-9A09 | ||
法律状态 | - |
摘要
摘要 | 本公开涉及基于知识图谱的字段级的数据血缘确定方法及装置,包括:获取第一数据表对中两个数据表各自的表名和表结构信息;第一数据表对包括数据库中的任意两个数据表;计算第一数据表对中两个数据表的表名之间的第一表名相似度,以及计算表结构信息中字段之间的相似度,得到第一字段相似度矩阵;根据第一表名相似度、第一字段相似度矩阵和预先获取的目标权值,确定第一数据表对中两个数据表之间是否具有血缘关系;获取多个具有血缘关系的第一数据表对作为目标数据表对;根据知识图谱和目标数据表对中数据表之间的血缘关系,生成字段级的数据关系图谱。本公开能够降低确定数据表的血缘关系的难度,提升血缘关系的确定准确性。 |
