一种大数据清洗方法、系统及相关装置
基本信息
申请号 | CN201910085511.0 | 申请日 | - |
公开(公告)号 | CN109800220B | 公开(公告)日 | 2020-12-15 |
申请公布号 | CN109800220B | 申请公布日 | 2020-12-15 |
分类号 | G06F16/215 | 分类 | 计算;推算;计数; |
发明人 | 胡晖;廖建克 | 申请(专利权)人 | 浙江国贸云商控股有限公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 罗满 |
地址 | 310000 浙江省杭州市江干区红普路绿谷创新中心6号楼8楼 | ||
法律状态 | - |
摘要
摘要 | 本申请所提供的一种大数据清洗方法,包括:采用与数据来源对应的数据获取方法采集贸易数据;在将贸易数据进行存储后,获取贸易数据中的目标数据;利用分子筛算法对目标数据进行聚合处理,得到清洗后的各个结果集。可见,该方法利用分子筛算法对目标数据进行聚合处理,得到清洗后的各个结果集,也就是说可以将异类值过滤掉,进而提高数据清洗修正的精度。此外,本申请还克服了相关技术中数据清洗颗粒度不够、收敛速度较慢等问题。本申请还提供一种大数据清洗系统、设备及计算机可读存储介质,均具有上述有益效果。 |
