风控模型入模变量最小熵分箱方法

基本信息

申请号 CN202010296690.5 申请日 -
公开(公告)号 CN111507824A 公开(公告)日 2020-08-07
申请公布号 CN111507824A 申请公布日 2020-08-07
分类号 G06Q40/02;G06N3/12;G06K9/62 分类 -
发明人 刘星辰;陈晓峰;麻沁甜 申请(专利权)人 上海勃池信息技术有限公司
代理机构 上海骁象知识产权代理有限公司 代理人 上海勃池信息技术有限公司
地址 201815 上海市嘉定区汇源路55号8幢5层517室
法律状态 -

摘要

摘要 本发明公开一种风控模型入模变量最小熵分箱方法,包括:获取类别平衡的建模样本集;针对建模样本集,通过相关性和关联性等分析筛选风控模型的入模变量,并进行预处理;将入模变量中的连续变量分别预设一个分箱数,并针对各变量进行多次随机分箱,获得一组分箱方案;在初始的一组分箱方案基础上以最小熵为优化目标,采用遗传算法和模拟退火算法等启发式搜索方法,多次迭代获得全局最优分箱方法;将分箱后的变量进行WOE转换等处理后输入风控模型进行训练。采用本发明实施例提供的方案,在实现自动化分箱的同时保证分箱的合理性,有利于提升风控模型的训练和预测精度。