一种金融电销场景中对负样本做消减的采样方法
基本信息

| 申请号 | CN202011393908.5 | 申请日 | - |
| 公开(公告)号 | CN112463781A | 公开(公告)日 | 2021-03-09 |
| 申请公布号 | CN112463781A | 申请公布日 | 2021-03-09 |
| 分类号 | G06F16/215(2019.01)I;G06Q40/00(2012.01)I;G06F16/28(2019.01)I;G06Q10/06(2012.01)I | 分类 | 计算;推算;计数; |
| 发明人 | 田兴邦;何国涛;蒲瑶;李全忠 | 申请(专利权)人 | 普强时代(珠海横琴)信息技术有限公司 |
| 代理机构 | 北京科亿知识产权代理事务所(普通合伙) | 代理人 | 汤东凤 |
| 地址 | 100000北京市海淀区北清路四维图新大厦F座二层 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明提供一种金融电销场景中对负样本做消减的采样方法,具体步骤为:从金融场景营销的数据获取客户结构化维度,将数据分为三个子集,分别占全量比为80%(A),10%(V),10%(T);对A数据子集的正例集做聚类;计算在所有类边界外的V数据子集和T数据子集所有的正例个数和负例个数;计算V数据子集的正反例个数比:V_r;T数据子集的正反例个数比:T_r;并计算D_r=|T_r‑V_r|;将T数据子集所有边界外的正/反例记录为S_w;对每一维度值为数字的重复上面的计算,累记每一维度的边界;将所有S_w联集为S_all,计算S_all中的正例个数,反例个数;假设原本分类器对T数据子集的AUC值为auc,计算新的AUC值AUC_new。本发明所提出的方法为非随机的,能准确的将多数的样例减少而同时控制少数的样例的减少,因此能同时保证AUC不下降。 |





