基于ANTLR的数据字段血缘分析方法及装置

基本信息

申请号 CN202110532500.X 申请日 -
公开(公告)号 CN113220800A 公开(公告)日 2021-08-06
申请公布号 CN113220800A 申请公布日 2021-08-06
分类号 G06F16/28(2019.01)I;G06F8/41(2018.01)I 分类 计算;推算;计数;
发明人 查星宇;徐杰;丁凯;郭丰俊;龙腾;陈青山 申请(专利权)人 上海生腾数据科技有限公司
代理机构 上海双霆知识产权代理事务所(普通合伙) 代理人 殷晓雪
地址 200436上海市静安区万荣路1256、1258号1105-1123室
法律状态 -

摘要

摘要 本申请公开了一种基于ANTLR的数据字段血缘分析方法。将与查询有关的非SQL代码自动转换为SQL的形式,执行SQL代码生成数据集,为数据集创建数据集对象。为每一个数据集对象打上水印,在数据集对象之间形成链表,将每个链表中所有数据集对象对应的SQL代码进行拼接。将每一段拼接好的SQL代码送入ANTLR生成具体语法树。在具体语法树中进行裁枝式访问,完成裁枝式访问后生成第一中缀表达式。从所访问的具体语法树的每个节点中提取出操作符和所需的文字变量,将第一中缀表达式扩充为第二中缀表达式。将第二中缀表达式转换为后缀表达式;后缀表达式的运算结果完整记录了每个目标数据字段的来源及变化过程,即实现了目标数据字段的血缘分析。