一种实现混合数据分析的大数据处理方法

基本信息

申请号 CN202110598362.5 申请日 -
公开(公告)号 CN113342790A 公开(公告)日 2021-09-03
申请公布号 CN113342790A 申请公布日 2021-09-03
分类号 G06F16/215(2019.01)I;G06F16/26(2019.01)I;G06F16/27(2019.01)I;G06F16/904(2019.01)I;G06F16/906(2019.01)I 分类 计算;推算;计数;
发明人 骆啸宇;郑理 申请(专利权)人 重庆大数据人工智能创新中心有限公司
代理机构 北京挺立专利事务所(普通合伙) 代理人 贾楠楠
地址 400052重庆市九龙坡区西彭镇西竹路2栋33号
法律状态 -

摘要

摘要 本发明公开了一种实现混合数据分析的大数据处理方法,通过在数据预处理单元中设置数据清洗模块,数据清洗模块又包括遗漏数据处理、噪声数据处理和不一致数据处理三个不同子模块,遗漏数据处理子模块基于同类别均值进行遗漏值填补,噪声数据处理子模块可通过聚类分析方法帮助发现异常数据,不一致数据处理子模块能够自动查出数据库中岀现记录内容不一致的数据,通过上述数据清洗预处理,能够将混合数据中的大多数异常数据清洗掉,从而为后续大数据处理和分析数据内容提供可靠数据来源,提高数据处理的准确度,提高用户使用体验以及为企业经营决策提供更准确和更可靠的参照信息。