一种基于SBS的层次化特征选择方法、系统及应用

基本信息

申请号 CN201910342155.6 申请日 -
公开(公告)号 CN110197706B 公开(公告)日 2021-08-27
申请公布号 CN110197706B 申请公布日 2021-08-27
分类号 G16H10/60(2018.01)I;G16H50/70(2018.01)I;G06K9/62(2006.01)I 分类 物理
发明人 罗宁政;蔡志平;孙文成;王明;刘海滨;黄克涛;胡健;黄浪 申请(专利权)人 深圳市宁远科技股份有限公司
代理机构 长沙国科天河知识产权代理有限公司 代理人 邱轶
地址 518000广东省深圳市南山区南山街道东滨路4078号永新时代广场2号楼11-12楼
法律状态 -

摘要

摘要 本发明提供一种基于SBS的层次化特征选择方法、系统及应用,该方法包括获取数据集;根据CatBoost模型拟合所有的类别集,获取每个类别集的权重值W1;根据XGBoost模型拟合所有的特征数据集,获取每个特征数据的重要性分数W2;根据每个类别集的权重值W1及每个特征数据的重要性分数W2,获取每个项目的全局参数W=W1*W2;并对每个特征数据按照全局参数W由高到低进行排序;根据SBS算法,每轮迭代删除排名最差的特征数据,并记录剩余子集的均方差值MSE;获取标均差值MSE最小的剩余子集,作为最优子集O输出。用于解决现有技术中数据处理的实用性和准确性不高等问题,基于数据内部的联系进行层次化特征选择,提高数据处理的实用性和准确性。