一种基于SBS的层次化特征选择方法、系统及应用
基本信息
申请号 | CN201910342155.6 | 申请日 | - |
公开(公告)号 | CN110197706B | 公开(公告)日 | 2021-08-27 |
申请公布号 | CN110197706B | 申请公布日 | 2021-08-27 |
分类号 | G16H10/60(2018.01)I;G16H50/70(2018.01)I;G06K9/62(2006.01)I | 分类 | 物理 |
发明人 | 罗宁政;蔡志平;孙文成;王明;刘海滨;黄克涛;胡健;黄浪 | 申请(专利权)人 | 深圳市宁远科技股份有限公司 |
代理机构 | 长沙国科天河知识产权代理有限公司 | 代理人 | 邱轶 |
地址 | 518000广东省深圳市南山区南山街道东滨路4078号永新时代广场2号楼11-12楼 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种基于SBS的层次化特征选择方法、系统及应用,该方法包括获取数据集;根据CatBoost模型拟合所有的类别集,获取每个类别集的权重值W1;根据XGBoost模型拟合所有的特征数据集,获取每个特征数据的重要性分数W2;根据每个类别集的权重值W1及每个特征数据的重要性分数W2,获取每个项目的全局参数W=W1*W2;并对每个特征数据按照全局参数W由高到低进行排序;根据SBS算法,每轮迭代删除排名最差的特征数据,并记录剩余子集的均方差值MSE;获取标均差值MSE最小的剩余子集,作为最优子集O输出。用于解决现有技术中数据处理的实用性和准确性不高等问题,基于数据内部的联系进行层次化特征选择,提高数据处理的实用性和准确性。 |
