一种基于集成学习技术的高维度数据预测方法专利查询专利号|摘要-满商公司网

一种基于集成学习技术的高维度数据预测方法

基本信息

摘要

摘要	本发明公开了一种基于集成学习技术的高维度数据预测方法，首先对原始高维数据进行预处理，包括缺失值和异常值的处理、去除重复数据等；接着利用GBDT特征重要性方法进行特征筛选，并利用遗传算法进一步优化筛选结果，尽量在不改变原始特征的前提下对数据集进行降维；在此基础上，本发明利用Stacking集成学习的思想构建集成模型，对数据进行回归预测，并评估方法的效果。本发明充分考虑了高维度数据多特征、小样本的特点，具有鲁棒性强、精度高、泛化能力强的特点，可以充分挖出出原始数据中的潜在规律，提供更加精细化的决策支持。