一种异构数据源的数据预处理方法
基本信息
申请号 | CN201610789185.8 | 申请日 | - |
公开(公告)号 | CN106372185B | 公开(公告)日 | 2017-07-04 |
申请公布号 | CN106372185B | 申请公布日 | 2017-07-04 |
分类号 | G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 李志敏;梁柏超;贺文锋 | 申请(专利权)人 | 广东名阳信息科技有限公司 |
代理机构 | 北京孚睿湾知识产权代理事务所(普通合伙) | 代理人 | 李丹丹 |
地址 | 528200 广东省佛山市桂城街道深海路17号瀚天科技城A区8号楼十楼1004单元 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种异构数据源的数据预处理方法,包括以下步骤:从多个异构数据源中读取异构数据;基于预处理规则库对所述异构数据进行预处理得到规格化数据;将所述规格化数据存储在数据库中,用于数据集成、数据挖掘和/或企业的在线联机分析处理。其使得政法业务数据可以共享,该方法通用性好,易于扩展,并对数据进行递进式的三次预处理,且处理过程可以回溯,使得处理规则易于修改,提高了数据处理效率及处理精度,且能基于错误的日志修改提取规则,将数据统一存储提供对外服务。 |
