一种基于机器学习的跨站脚本攻击识别方法

基本信息

申请号 CN202111195689.4 申请日 -
公开(公告)号 CN114124448A 公开(公告)日 2022-03-01
申请公布号 CN114124448A 申请公布日 2022-03-01
分类号 H04L9/40(2022.01)I;G06K9/62(2022.01)I 分类 电通信技术;
发明人 刘兵;谢鑫;何召阳;任玉坤;何晓刚;郗朝旭 申请(专利权)人 北京墨云科技有限公司
代理机构 北京巨弘知识产权代理事务所(普通合伙) 代理人 赵洋
地址 100085北京市海淀区上地信息路12号1幢4层C401
法律状态 -

摘要

摘要 本发明公开了一种基于机器学习的跨站脚本攻击识别方法,包括以下步骤:S1、网页数据收集:搭建含有跨站脚本攻击漏洞的靶场,使用扫描器和人工渗透的方式收集含有跨站脚本攻击的相关数据,对相关数据进行分类标注;S2、数据特征工程:对相关数据进行数据清洗;S3、数据特征化分析:将跨站脚本攻击语句视为文本信息,进行文本特征抽取,生成分词信息;S4、机器学习:将分词信息通过XGBoost集成算法模型进行训练,得到用于跨站脚本攻击识别的分类器模型;S5、跨站脚本攻击识别:将Web请求数据经过特征工程及向量化处理后进入分类器模型进行预测,识别跨站脚本攻击。本发明能够有效提高跨站脚本攻击识别效率,提高安全性。