处理特征变量的方法、计算机可读存储介质及计算机设备

基本信息

申请号 CN201910057671.4 申请日 -
公开(公告)号 CN109816117A 公开(公告)日 2019-05-28
申请公布号 CN109816117A 申请公布日 2019-05-28
分类号 G06N20/00(2019.01)I 分类 计算;推算;计数;
发明人 柴磊; 许靖; 李红一; 尹帅 申请(专利权)人 深圳魔数智擎科技有限公司
代理机构 深圳市铭粤知识产权代理有限公司 代理人 深圳魔数智擎科技有限公司;深圳市魔数智擎人工智能有限公司
地址 518000 广东省深圳市南山区前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)
法律状态 -

摘要

摘要 本发明公开了一种处理特征变量的方法。所述方法包括:获取多个包括多个特征变量的样本中每个特征变量的缺失率和偏离度;根据每个特征变量的所述缺失率和所述偏离度计算出对应每个特征变量的惩罚因子;利用所述惩罚因子对相应的特征变量进行惩罚处理。本发明可有效处理存在值缺失和/或是分类型特征变量的特征变量,该方法可提升机器学习模型的精度,同时还能够降低机器学习模型过拟合的情况。