一种高维不完整数据特征选择方法
基本信息
申请号 | CN201710388939.3 | 申请日 | - |
公开(公告)号 | CN107220346B | 公开(公告)日 | 2021-04-30 |
申请公布号 | CN107220346B | 申请公布日 | 2021-04-30 |
分类号 | G06F16/28 | 分类 | 计算;推算;计数; |
发明人 | 李玉诺;尹春福;王妍;杨钧;李俊;吴阳;付永全 | 申请(专利权)人 | 荣科科技股份有限公司 |
代理机构 | 沈阳杰克知识产权代理有限公司 | 代理人 | 罗莹 |
地址 | 110027 辽宁省沈阳市经济技术开发区开发大路7甲3号 | ||
法律状态 | - |
摘要
摘要 | 一种高维不完整数据特征选择方法,涉及如下步骤:(1)判断初始数据是否为完整数据;若为不完整数据,则转到步骤(2);若为完整数据,则转到步骤(3);步骤(2):假设现在有各个维度的数据,用1表示该数据项是完整的,用0表示该数据项是缺失的.计算每个维度的缺失率,接着计算缺失熵:依次算出每个维度的缺失熵;对结果进行加权平均;步骤(3):在高维数据中进行特征选择时,通过比较原始数据矩阵的相关矩阵和随机矩阵在奇异值上的差异,对相关矩阵进行去噪。得到去噪后的相关矩阵和选择特征的数量,再进行奇异值分解,通过分解矩阵获得特征与类的相关性,根据特征与类的相关性和特征之间冗余性完成特征选择。 |
