一种基于多维度分析的数据篡改监测和识别方法、装置、电子设备及其存储介质
基本信息
申请号 | CN202010908124.5 | 申请日 | - |
公开(公告)号 | CN111967063B | 公开(公告)日 | 2021-04-09 |
申请公布号 | CN111967063B | 申请公布日 | 2021-04-09 |
分类号 | G06F16/958(2019.01)I;G06F21/64(2013.01)I;G06F40/279(2020.01)I;G06K9/62(2006.01)I;G06F16/951(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 汪敏;严妍;肖国泉;裴非;肖克;彭祖剑;邵罗树;尹娜 | 申请(专利权)人 | 开普云信息科技股份有限公司 |
代理机构 | - | 代理人 | - |
地址 | 523000广东省东莞市石龙镇中山东东升路1号汇星商业中心5栋2单元1805室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于多维度分析的数据篡改监测和识别方法、装置、电子设备及其存储介质,属于互联网内容安全监测技术领域。所述方法应用于服务器,从网页中抽取网页特征,通过分类算法构建篡改二分类模型,利用fasttext算法对模型进行机器学习分类训练,并通过DNS分析、网页结构分析、暗链/外链分析、词库/规则匹配分析多个维度进行监测,对模型训练数据和各维度监测数据进行综合评分,最终得到监测结果。本技术方案将DNS分析、网页结构分析、暗链/外链分析、词库/规则匹配分析、篡改二分类模型分析技术相融合,相比传统仅采用一项分析技术的监测方法而言,从多个维度、多个特质综合多项分析技术进行监测和统一分析,能有效减少误报、漏报情况;并且,通过制定和采用一定规则,同时实施多项分析技术,将近时间内分析结果存入缓存中,能有效避免重复计算,高并发处理海量网页,使处理速度远高于常规监测手段。 |
