基于知识图谱的字段级的数据血缘确定方法及装置

基本信息

申请号 CN202011626496.5 申请日 -
公开(公告)号 CN112711591B 公开(公告)日 2021-10-08
申请公布号 CN112711591B 申请公布日 2021-10-08
分类号 G06F16/22;G06F16/36;G06K9/62 分类 计算;推算;计数;
发明人 雷涛;乔旺龙;赵琳;曹晓磊 申请(专利权)人 天云融创数据科技(北京)有限公司
代理机构 北京开阳星知识产权代理有限公司 代理人 安伟
地址 100025 北京市朝阳区东四环中路78号大成国际中心A1座9A08-9A09
法律状态 -

摘要

摘要 本公开涉及基于知识图谱的字段级的数据血缘确定方法及装置,包括:获取第一数据表对中两个数据表各自的表名和表结构信息;第一数据表对包括数据库中的任意两个数据表;计算第一数据表对中两个数据表的表名之间的第一表名相似度,以及计算表结构信息中字段之间的相似度,得到第一字段相似度矩阵;根据第一表名相似度、第一字段相似度矩阵和预先获取的目标权值,确定第一数据表对中两个数据表之间是否具有血缘关系;获取多个具有血缘关系的第一数据表对作为目标数据表对;根据知识图谱和目标数据表对中数据表之间的血缘关系,生成字段级的数据关系图谱。本公开能够降低确定数据表的血缘关系的难度,提升血缘关系的确定准确性。