一种信贷变量数据的进行高纬变量筛选的方法
基本信息
申请号 | CN202111494508.8 | 申请日 | - |
公开(公告)号 | CN114119211A | 公开(公告)日 | 2022-03-01 |
申请公布号 | CN114119211A | 申请公布日 | 2022-03-01 |
分类号 | G06Q40/02(2012.01)I;G06F17/18(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 钟磊;田羽;刘银龙;段笑;游江珊 | 申请(专利权)人 | 武汉众邦银行股份有限公司 |
代理机构 | 成都正煜知识产权代理事务所(普通合伙) | 代理人 | 李龙 |
地址 | 432200湖北省武汉市黄陂区盘龙城经济开发区汉口北大道88号汉口北国际商品交易中心D2区1-2层、22-23层 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及信用评分建模领域,提供了一种信贷变量数据的进行高纬变量筛选的方法。目的在于解决如何充分筛选高维变量,尝试构建一种新的变量筛选方法来辅助信用评分建模,确保得到的建模模型的最佳准确度。主要方案包括获取申请数据、放款数据、逾期数据、征信数据;截取一段时间的数据,根据cumauc归纳方法对提取的数据进行初步筛选,选取auc值大的数据;对初步筛选的变量进行卡方分箱,卡方分箱使得每个数据有单独的权重,为后续的评分模型引入非线性,降低了模型过拟合的风险,选取权重较高的数据;根据筛选得到的数据进行stepwise逐步回归分析,最终得到所有的符合筛选条件的数据。 |
