一种可配置数据清洗系统和方法

基本信息

申请号 CN201810677790.5 申请日 -
公开(公告)号 CN108984652A 公开(公告)日 2018-12-11
申请公布号 CN108984652A 申请公布日 2018-12-11
分类号 G06F17/30 分类 计算;推算;计数;
发明人 陈鹏林;郝东进;沈惟冉;王腾龙 申请(专利权)人 北京亚融方成科技有限公司
代理机构 北京国昊天诚知识产权代理有限公司 代理人 北京圣康汇金科技有限公司
地址 100081 北京市海淀区学院南路62号中关村资本大厦407室
法律状态 -

摘要

摘要 本申请公开了一种可配置数据清洗系统和方法,包括任务控制器、清洗工具、第一配置表、第二配置表、第三配置表。第一配置表包括任务编码和清洗工具。第二配置表包括任务编码、数据标识、源数据库、目标数据库和清洗规则标识。源数据库中包括源字段,目标数据库中包括目标字段。第三配置表包括数据标识、字段名称、源字段、目标字段和转换规则标识。任务控制器读取配置表,调用清洗工具。清洗工具根据任务编码对应的数据标识从源数据库中读取源数据、确定清洗规则、按照清洗规则筛选源数据。确定字段名称对应的转换规则标识,由源字段的数据转换为目标字段的数据,发送至目标数据库。所述系统和方法保证了数据清洗的连贯性,有效利用时间和资源。