基于随机森林算法的host名字特征预测方法
基本信息
申请号 | CN201911197987.X | 申请日 | - |
公开(公告)号 | CN111062520A | 公开(公告)日 | 2020-04-24 |
申请公布号 | CN111062520A | 申请公布日 | 2020-04-24 |
分类号 | G06Q10/04;G06N20/00;G06K9/62;G06F16/27 | 分类 | 计算;推算;计数; |
发明人 | 杨光来 | 申请(专利权)人 | 苏州迈科网络安全技术股份有限公司 |
代理机构 | 南京苏科专利代理有限责任公司 | 代理人 | 苏州迈科网络安全技术股份有限公司 |
地址 | 215000 江苏省苏州市苏州工业园区金芳路18号东坊创智园地B2栋5楼 | ||
法律状态 | - |
摘要
摘要 | 本发明揭示了一种基于随机森林算法的host名字特征预测方法,包括如下步骤:S1、数据预处理,从集群中读取原始数据,并对原始数据进行筛选、特征工程以及向量化操作,获得数据集;S2、模型训练,将数据集放入随机森林模型中进行训练,判断模型是否满足模型评估条件,将满足条件的模型作为预测模型并导出;S3、模型部署,对预测模型进行部署、将模型投入应用;S4、模型反馈,对预测模型的输出结果进行反馈处理,并将结果作为新的模型训练数据输入至模型中,迭代训练、完成模型更新。本发明重构了特征提取流程,并利用机器学习模型训练的方式完成了对特征是否可用的预测,不仅保证了最终输出结果的准确性,同时也节约了人工。 |
