一种信贷变量数据的进行高纬变量筛选的方法

基本信息

申请号 CN202111494508.8 申请日 -
公开(公告)号 CN114119211A 公开(公告)日 2022-03-01
申请公布号 CN114119211A 申请公布日 2022-03-01
分类号 G06Q40/02(2012.01)I;G06F17/18(2006.01)I 分类 计算;推算;计数;
发明人 钟磊;田羽;刘银龙;段笑;游江珊 申请(专利权)人 武汉众邦银行股份有限公司
代理机构 成都正煜知识产权代理事务所(普通合伙) 代理人 李龙
地址 432200湖北省武汉市黄陂区盘龙城经济开发区汉口北大道88号汉口北国际商品交易中心D2区1-2层、22-23层
法律状态 -

摘要

摘要 本发明涉及信用评分建模领域,提供了一种信贷变量数据的进行高纬变量筛选的方法。目的在于解决如何充分筛选高维变量,尝试构建一种新的变量筛选方法来辅助信用评分建模,确保得到的建模模型的最佳准确度。主要方案包括获取申请数据、放款数据、逾期数据、征信数据;截取一段时间的数据,根据cumauc归纳方法对提取的数据进行初步筛选,选取auc值大的数据;对初步筛选的变量进行卡方分箱,卡方分箱使得每个数据有单独的权重,为后续的评分模型引入非线性,降低了模型过拟合的风险,选取权重较高的数据;根据筛选得到的数据进行stepwise逐步回归分析,最终得到所有的符合筛选条件的数据。