一种用于探测HIVE数据库数据血缘的方法及系统
基本信息
申请号 | CN202110211183.1 | 申请日 | - |
公开(公告)号 | CN112925777A | 公开(公告)日 | 2021-06-08 |
申请公布号 | CN112925777A | 申请公布日 | 2021-06-08 |
分类号 | G06F16/215;G06F16/248;G06F16/28 | 分类 | 计算;推算;计数; |
发明人 | 苏瑀;陈筱进;刘登贺;张世杰 | 申请(专利权)人 | 吉林亿联银行股份有限公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 钱娜 |
地址 | 130000 吉林省长春市南关区人民大街10606号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种用于探测HIVE数据库数据血缘的方法及系统,方法包括:配置LineageLogger Hook功能;基于LineageLogger Hook功能对HiveSql进行解析,生成hive.log日志;对hive.log日志进行数据清洗形成JOIN格式,并将清洗后的数据数据导入至开源图数据库neo4j;利用neo4j接口查询字段之间的依赖关系;调用图数据库neo4j API接口,解析JSON串,将数据血缘进行可视化显示。本发明能够有效的完成各个数据表、字段之间的数据血缘关系的分析和梳理。 |
