金融风控领域多特征融合提取方法
基本信息
申请号 | CN201710272618.7 | 申请日 | - |
公开(公告)号 | CN107423871A | 公开(公告)日 | 2017-12-01 |
申请公布号 | CN107423871A | 申请公布日 | 2017-12-01 |
分类号 | G06Q10/06;G06Q40/00 | 分类 | 计算;推算;计数; |
发明人 | 张林江 | 申请(专利权)人 | 成都知数科技有限公司 |
代理机构 | 成都顶峰专利事务所(普通合伙) | 代理人 | 任远高 |
地址 | 610000 四川省成都市高新西区西芯大道4号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及金融网控技术领域,公开了金融风控领域多特征融合提取方法,获取原始用户ID对应的原始样本数据;对获取的原始样本数据中的脏数据进行数据清洗;提取基础数据构成基础特征,并将基础特征与原始用户ID进行一一对应关联产生训练样本;将训练样本录入至机器学习模型中,所述机器学习模型中设有随机森林,随机森林中包含有多个决策树模型,经过决策树模型训练后形成一系列的叶子节点,并通过one‑hot编码对叶子节点进行离散编码,离散编码与原始用户ID对应形成用户的离散特征;将分别对应有相同原始用户ID的基础特征和离散特征进行关联合并得到的聚合训练数据,解决了现有的特征处理模式单一、特征暴力组合导致数据呈指数型爆炸的问题。 |
