基于深度学习和半监督学习的webshell检测方法及装置

基本信息

申请号 CN201810623283.3 申请日 -
公开(公告)号 CN108833409B 公开(公告)日 2021-03-16
申请公布号 CN108833409B 申请公布日 2021-03-16
分类号 G06F21/57(2013.01)I;H04L29/06(2006.01)I;G06N3/08(2006.01)I 分类 电通信技术;
发明人 吴斌;赵力;朱和稳;韩传富 申请(专利权)人 北京网思科平科技有限公司
代理机构 北京知呱呱知识产权代理有限公司 代理人 吕学文;武媛
地址 100086北京市海淀区马连洼北路125号亿城国际中心525
法律状态 -

摘要

摘要 基于深度学习和半监督学习的webshell检测方法及装置,获取原始的训练样本,选取有标记样本进行分词处理,通过卡方检验分析特征词与标签之间的相关性,选择相关性最强的前K个特征词作为筛选特征词;采用筛选特征词对未标记样本进行特征词筛选,作为未标记样本特征;对获取的未标记样本特征使用神经网络算法训练,获得各个未标记样本的文本向量;使用无监督方法训练单分类SVDD模型,优化超球面半径最小化,最大情况包含未标记样本;对于新的标记样本,运用在线学习方式增量训练SVDD模型,修正单分类SVDD模型;将最新模型用于新样本的预测。本发明能够有效改善传统webshell检测的漏报率和误报率。