一种基于SBS的层次化特征选择方法、系统及应用

基本信息

申请号 CN201910342155.6 申请日 -
公开(公告)号 CN110197706A 公开(公告)日 2019-09-03
申请公布号 CN110197706A 申请公布日 2019-09-03
分类号 G16H10/60(2018.01)I; G16H50/70(2018.01)I; G06K9/62(2006.01)I 分类 物理
发明人 罗宁政; 蔡志平; 孙文成; 王明; 刘海滨; 黄克涛; 胡健; 黄浪 申请(专利权)人 深圳市宁远科技股份有限公司
代理机构 长沙国科天河知识产权代理有限公司 代理人 深圳市宁远科技股份有限公司
地址 518000 广东省深圳市南山区南山街道东滨路4078号永新时代广场2号楼11-12楼
法律状态 -

摘要

摘要 本发明提供一种基于SBS的层次化特征选择方法、系统及应用,该方法包括获取数据集;根据CatBoost模型拟合所有的类别集,获取每个类别集的权重值W1;根据XGBoost模型拟合所有的特征数据集,获取每个特征数据的重要性分数W2;根据每个类别集的权重值W1及每个特征数据的重要性分数W2,获取每个项目的全局参数W=W1*W2;并对每个特征数据按照全局参数W由高到低进行排序;根据SBS算法,每轮迭代删除排名最差的特征数据,并记录剩余子集的均方差值MSE;获取标均差值MSE最小的剩余子集,作为最优子集O输出。用于解决现有技术中数据处理的实用性和准确性不高等问题,基于数据内部的联系进行层次化特征选择,提高数据处理的实用性和准确性。