金融风控领域多特征融合提取方法

基本信息

申请号 CN201710272618.7 申请日 -
公开(公告)号 CN107423871A 公开(公告)日 2017-12-01
申请公布号 CN107423871A 申请公布日 2017-12-01
分类号 G06Q10/06;G06Q40/00 分类 计算;推算;计数;
发明人 张林江 申请(专利权)人 成都知数科技有限公司
代理机构 成都顶峰专利事务所(普通合伙) 代理人 任远高
地址 610000 四川省成都市高新西区西芯大道4号
法律状态 -

摘要

摘要 本发明涉及金融网控技术领域,公开了金融风控领域多特征融合提取方法,获取原始用户ID对应的原始样本数据;对获取的原始样本数据中的脏数据进行数据清洗;提取基础数据构成基础特征,并将基础特征与原始用户ID进行一一对应关联产生训练样本;将训练样本录入至机器学习模型中,所述机器学习模型中设有随机森林,随机森林中包含有多个决策树模型,经过决策树模型训练后形成一系列的叶子节点,并通过one‑hot编码对叶子节点进行离散编码,离散编码与原始用户ID对应形成用户的离散特征;将分别对应有相同原始用户ID的基础特征和离散特征进行关联合并得到的聚合训练数据,解决了现有的特征处理模式单一、特征暴力组合导致数据呈指数型爆炸的问题。