一种基于stacking和bagging算法的电费敏感用户分析方法

基本信息

申请号 CN201710780176.7 申请日 -
公开(公告)号 CN107507038B 公开(公告)日 2021-03-19
申请公布号 CN107507038B 申请公布日 2021-03-19
分类号 G06Q30/02(2012.01)I;G06Q50/06(2012.01)I 分类 计算;推算;计数;
发明人 程宏亮;黄蓉;贾珍妮;程怡馨 申请(专利权)人 美林数据技术股份有限公司
代理机构 西安毅联专利代理有限公司 代理人 杨燕珠
地址 710000陕西省西安市高新区科技二路68号西安软件园汉韵阁C501
法律状态 -

摘要

摘要 本发明公开了一种基于stacking和bagging算法的电费敏感用户分析方法,根据电费敏感的分类目标,基于电费敏感的原始数据表的几个核心业务指标,利用优区算法,解决非平衡和不相容问题,构建训练集和测试集。一方面,进一步细化基于电费敏感相关的核心业务结构化特征。另一方面,基于分词和词频统计的非结构化文本特征,利用stacking方法构建电费敏感的初级模型,为每个样本生成扩展的stacking特征。然后,将二者的特征进行合并作为整体输入。这样利用bagging和vote算法,在训练集和测试集上构建电费敏感的次级模型。利用训练好的模型,对验证集进行预测,并在实际业务中进行验证。从而,能提高了电力公司对用户的电费敏感度的掌握,有利于为电力客户提供差异化、针对性的优质供电服务。