一种基于stacking和bagging算法的电费敏感用户分析方法
基本信息
申请号 | CN201710780176.7 | 申请日 | - |
公开(公告)号 | CN107507038B | 公开(公告)日 | 2021-03-19 |
申请公布号 | CN107507038B | 申请公布日 | 2021-03-19 |
分类号 | G06Q30/02(2012.01)I;G06Q50/06(2012.01)I | 分类 | 计算;推算;计数; |
发明人 | 程宏亮;黄蓉;贾珍妮;程怡馨 | 申请(专利权)人 | 美林数据技术股份有限公司 |
代理机构 | 西安毅联专利代理有限公司 | 代理人 | 杨燕珠 |
地址 | 710000陕西省西安市高新区科技二路68号西安软件园汉韵阁C501 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于stacking和bagging算法的电费敏感用户分析方法,根据电费敏感的分类目标,基于电费敏感的原始数据表的几个核心业务指标,利用优区算法,解决非平衡和不相容问题,构建训练集和测试集。一方面,进一步细化基于电费敏感相关的核心业务结构化特征。另一方面,基于分词和词频统计的非结构化文本特征,利用stacking方法构建电费敏感的初级模型,为每个样本生成扩展的stacking特征。然后,将二者的特征进行合并作为整体输入。这样利用bagging和vote算法,在训练集和测试集上构建电费敏感的次级模型。利用训练好的模型,对验证集进行预测,并在实际业务中进行验证。从而,能提高了电力公司对用户的电费敏感度的掌握,有利于为电力客户提供差异化、针对性的优质供电服务。 |
