一种高维不完整数据特征选择方法

基本信息

申请号 CN201710388939.3 申请日 -
公开(公告)号 CN107220346B 公开(公告)日 2021-04-30
申请公布号 CN107220346B 申请公布日 2021-04-30
分类号 G06F16/28 分类 计算;推算;计数;
发明人 李玉诺;尹春福;王妍;杨钧;李俊;吴阳;付永全 申请(专利权)人 荣科科技股份有限公司
代理机构 沈阳杰克知识产权代理有限公司 代理人 罗莹
地址 110027 辽宁省沈阳市经济技术开发区开发大路7甲3号
法律状态 -

摘要

摘要 一种高维不完整数据特征选择方法,涉及如下步骤:(1)判断初始数据是否为完整数据;若为不完整数据,则转到步骤(2);若为完整数据,则转到步骤(3);步骤(2):假设现在有各个维度的数据,用1表示该数据项是完整的,用0表示该数据项是缺失的.计算每个维度的缺失率,接着计算缺失熵:依次算出每个维度的缺失熵;对结果进行加权平均;步骤(3):在高维数据中进行特征选择时,通过比较原始数据矩阵的相关矩阵和随机矩阵在奇异值上的差异,对相关矩阵进行去噪。得到去噪后的相关矩阵和选择特征的数量,再进行奇异值分解,通过分解矩阵获得特征与类的相关性,根据特征与类的相关性和特征之间冗余性完成特征选择。