高频用户用电数据清洗方法、系统、设备及存储介质
基本信息
申请号 | CN202110624156.7 | 申请日 | - |
公开(公告)号 | CN113468152A | 公开(公告)日 | 2021-10-01 |
申请公布号 | CN113468152A | 申请公布日 | 2021-10-01 |
分类号 | G06F16/215(2019.01)I;G06Q50/06(2012.01)I | 分类 | 计算;推算;计数; |
发明人 | 郭乃网;田英杰;朱征;谢伟;瞿海妮;奚增辉;苏运;李凡;吴裔;赵莹莹;张菲菲;阮静娴;金妍斐 | 申请(专利权)人 | 国网上海能源互联网研究院有限公司 |
代理机构 | 上海科盛知识产权代理有限公司 | 代理人 | 丁云 |
地址 | 200122上海市浦东新区自由贸易试验区源深路1122号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种高频用户用电数据清洗方法、系统、设备及存储介质,所述的方法包括以下步骤:S1:读取用户用电数据;S2:对用户群进行切分;S3:对切分后的用户进行异常值的检测及剔除;S4:对用户用电数据进行预填充,获取预填充后的各用户用电数据的缺失率,剔除缺失率大于缺失率阈值的用户用电数据;S5:根据用户用电数据的连续缺失最大天数判断用户用电数据的缺失模式,根据缺失模式对用户用电数据进行填充;S6:对填充结果进行校验,利用邻近值填充法填充未填充数据,获取清洗结果。与现有技术相比,本发明有效提高数据清洗效果和填充效率,提高数据填充的准确性。 |
