一种垃圾数据深度过滤方法及系统

基本信息

申请号 CN202110122376.X 申请日 -
公开(公告)号 CN112784910A 公开(公告)日 2021-05-11
申请公布号 CN112784910A 申请公布日 2021-05-11
分类号 G06K9/62;G06N3/00;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 蒙政先;蔡楚才 申请(专利权)人 武汉市博畅软件开发有限公司
代理机构 武汉红观专利代理事务所(普通合伙) 代理人 陈凯
地址 430000 湖北省武汉市东湖开发区东门路以东、南环铁路以南、关山二路以西、中环线以北当代科技园(华夏创业中心)一期2号楼10层9号02室
法律状态 -

摘要

摘要 本发明公开一种垃圾数据深度过滤方法及系统,所述方法包括:获取网络数据,对所述网络数据进行五元组初步过滤;将初步过滤后的数据进行文本向量化表示,采用改进的k均值聚类算法对向量化表示的文本进行聚类划分,确定数据源,基于数据源进行二次过滤;基于卷积神经网络进行深度内容过滤。本发明实现了对非法数据和垃圾进行多层次深度过滤,保障数据安全,提高过滤精度。