一种大数据清洗方法、系统及相关装置

基本信息

申请号 CN201910085511.0 申请日 -
公开(公告)号 CN109800220B 公开(公告)日 2020-12-15
申请公布号 CN109800220B 申请公布日 2020-12-15
分类号 G06F16/215 分类 计算;推算;计数;
发明人 胡晖;廖建克 申请(专利权)人 浙江国贸云商控股有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 罗满
地址 310000 浙江省杭州市江干区红普路绿谷创新中心6号楼8楼
法律状态 -

摘要

摘要 本申请所提供的一种大数据清洗方法,包括:采用与数据来源对应的数据获取方法采集贸易数据;在将贸易数据进行存储后,获取贸易数据中的目标数据;利用分子筛算法对目标数据进行聚合处理,得到清洗后的各个结果集。可见,该方法利用分子筛算法对目标数据进行聚合处理,得到清洗后的各个结果集,也就是说可以将异类值过滤掉,进而提高数据清洗修正的精度。此外,本申请还克服了相关技术中数据清洗颗粒度不够、收敛速度较慢等问题。本申请还提供一种大数据清洗系统、设备及计算机可读存储介质,均具有上述有益效果。