一种基于人工智能算法的加密流量识别方法

基本信息

申请号 CN202210047506.2 申请日 -
公开(公告)号 CN114091087A 公开(公告)日 2022-02-25
申请公布号 CN114091087A 申请公布日 2022-02-25
分类号 G06F21/60(2013.01)I;G06K9/62(2022.01)I;G06N20/10(2019.01)I 分类 计算;推算;计数;
发明人 肖梅;陈柯杉;姚胜利;齐凯 申请(专利权)人 北京浩瀚深度信息技术股份有限公司
代理机构 北京沁优知识产权代理有限公司 代理人 周庆路
地址 100000北京市海淀区北洼路45号14号楼102
法律状态 -

摘要

摘要 本发明公开了一种基于人工智能算法的加密流量识别方法,所述加密流量识别方法包括以下步骤:S1、准备训练集,并将训练集分成训练集和验证集两部分,分别用于训练模型和验证训练结果;训练集包括有大量的业务报文,每个报文记录五元组、应用名称、流量类型。S2、计算训练集中所有的加密连接的关联HTTP连接并形成关联HTTP连接集合L;S3、基于步骤S2中得到关联HTTP连接集合L,利用机器学习分类算法训练每个加密连接的单包结构模型和流模型;S4、验证训练结果,利用训练后的模型识别验证集中的流量。本发明通过结合多流关联识别、单包识别和单流多包识别的方法,使得该加密流量识别方法可适用任何的加密流量,并且有效提高了加密流量的正确识别率。