一种数据质量稽核引擎及其稽核方法

基本信息

申请号 CN202110735553.1 申请日 -
公开(公告)号 CN113377758A 公开(公告)日 2021-09-10
申请公布号 CN113377758A 申请公布日 2021-09-10
分类号 G06F16/215(2019.01)I;G06F16/2458(2019.01)I 分类 计算;推算;计数;
发明人 郑丹辉;杨昊天;王程远;孟凡胜;郝亮 申请(专利权)人 数字郑州科技有限公司
代理机构 郑州睿信知识产权代理有限公司 代理人 吴敏
地址 450000河南省郑州市郑东新区中道东路6号创意岛大厦C区C-4-029房间
法律状态 -

摘要

摘要 本发明涉及一种数据质量稽核引擎及其稽核方法,该方法包括获取待稽查数据集的元数据和数据质量标准规范的质量规则项,从质量规则项中提取对应的特征词,元数据包括数据集名称、数据属性名称和数据属性注释;将特征词与元数据中的数据属性名称或者数据属性注释进行匹配,建立质量规则项和元数据中每个属性的关联关系;基于待稽查数据集中的属性和关联关系得到稽核任务;基于稽核任务与质量规则项对应的稽核处理方法,获得待稽查数据集的稽核处理方法,以生成待稽查数据集的稽核脚本;运行稽核脚本对待稽查数据集进行稽查以获得稽核结果。在本发明中,能够解决现有技术中稽核效率较低,配置任务工作繁重的问题。