一种异构数据源的数据预处理方法

基本信息

申请号 CN201610789185.8 申请日 -
公开(公告)号 CN106372185B 公开(公告)日 2017-07-04
申请公布号 CN106372185B 申请公布日 2017-07-04
分类号 G06F17/30 分类 计算;推算;计数;
发明人 李志敏;梁柏超;贺文锋 申请(专利权)人 广东名阳信息科技有限公司
代理机构 北京孚睿湾知识产权代理事务所(普通合伙) 代理人 李丹丹
地址 528200 广东省佛山市桂城街道深海路17号瀚天科技城A区8号楼十楼1004单元
法律状态 -

摘要

摘要 本发明提供了一种异构数据源的数据预处理方法,包括以下步骤:从多个异构数据源中读取异构数据;基于预处理规则库对所述异构数据进行预处理得到规格化数据;将所述规格化数据存储在数据库中,用于数据集成、数据挖掘和/或企业的在线联机分析处理。其使得政法业务数据可以共享,该方法通用性好,易于扩展,并对数据进行递进式的三次预处理,且处理过程可以回溯,使得处理规则易于修改,提高了数据处理效率及处理精度,且能基于错误的日志修改提取规则,将数据统一存储提供对外服务。