一种基于BoW模型和统计特征的流量识别方法

基本信息

申请号 CN201110419267.0 申请日 -
公开(公告)号 CN102571486B 公开(公告)日 2014-08-27
申请公布号 CN102571486B 申请公布日 2014-08-27
分类号 H04L12/26(2006.01)I;H04L12/24(2006.01)I 分类 电通信技术;
发明人 陈凯;张寅;周曲;周异;杨小康 申请(专利权)人 南京霁云信息科技有限公司
代理机构 上海汉声知识产权代理有限公司 代理人 上海交通大学;上海深杳智能科技有限公司;厦门商集网络科技有限责任公司
地址 200240 上海市闵行区上海市东川路800号
法律状态 -

摘要

摘要 本发明公开了一种基于BoW模型和统计特征的流量识别方法,该方法采用了BoW模型,配合提出的特征提取方法,训练采集到的网络流量特征,从而获得每一个网络类别所对应的特征向量。对于新来的网络流量,同样能够通过提取其流量特征,利用BoW建模得到其相应的特征向量,然后依次与先前建立好的每一个网络类别的特征向量进行比较,取匹配度最高的特征向量所对应的类别作为新来的网络流量的分类标签。本发明使用的BoW方法是结合了非监督的k-means聚类方法以及有监督的K-近邻方法,因而更适合于进行多分类。由于Bow模型对于空间位置不敏感,因而在提取特征时不需要按照特征的时序进行排列,方便进行处理。