基于样本比率悬殊时改进模型预测准确率的方法和系统专利查询专利号|摘要-满商公司网

基于样本比率悬殊时改进模型预测准确率的方法和系统

基本信息

摘要

摘要	本申请公开了一种基于样本比率悬殊时改进模型预测准确率的方法和系统。包括1)学习数据的预处理：通过供模型学习的所有数据进行抽样，将得到的抽样数据集与目标变量为1的数据拼成新的供模型学习的样本集；2)建立学习模型：将供模型学习的样本集做为模型学习集，供模型学习，得到学习好的模型；3)应用模型：将预测集变量放入学习好的模型，进行预测，获得样本预测label值；4)返回步骤1)进行多次循环，并标记每次循环获得的预测label值；5)重新标记：当n个label值中为1的占比大于β时将该样本标记为1，确认为正样本。本申请能排除偶然性将负样本误判为正样本的情况，从而提高改进模型预测准确率。