海量数据的清洗方法及装置
基本信息
申请号 | CN201910572435.6 | 申请日 | - |
公开(公告)号 | CN110334081A | 公开(公告)日 | 2019-10-15 |
申请公布号 | CN110334081A | 申请公布日 | 2019-10-15 |
分类号 | G06F16/21;G06F16/215 | 分类 | 计算;推算;计数; |
发明人 | 张鹏程;柳超 | 申请(专利权)人 | 北京天眼查科技有限公司 |
代理机构 | 北京清亦华知识产权代理事务所(普通合伙) | 代理人 | 北京天眼查科技有限公司 |
地址 | 100086 北京市海淀区知春路65号院1号楼B座19层1901 | ||
法律状态 | - |
摘要
摘要 | 本发明提出一种海量数据的清洗方法及装置,其中方法应用于消息消费者,包括:向预设的中间件发送消息获取请求;中间件用于从数据中心批量获取待清洗消息,并进行存储;接收中间件返回的待清洗消息;对待清洗消息进行清洗处理,得到清洗后消息;根据清洗后消息的标识,将清洗后消息存储至对应的数据库中,从而能够从数据中心批量拉取待清洗消息,缩短总的拉取时间,且拉取和清洗可以并行处理,从而缩短清洗时间,提高清洗效率,确保数据中心的数据无法得到及时清洗。进而提供数据时,提供清洗后数据,提高用户体验。 |
