一种黑产网站的识别方法及系统

基本信息

申请号 CN202111177434.5 申请日 -
公开(公告)号 CN113923022A 公开(公告)日 2022-01-11
申请公布号 CN113923022A 申请公布日 2022-01-11
分类号 H04L9/40(2022.01)I;H04L9/32(2006.01)I;G06F16/906(2019.01)I 分类 电通信技术;
发明人 薛跃;凌建国;辛阳;宋轶非 申请(专利权)人 上海安恒时代信息技术有限公司
代理机构 上海恒锐佳知识产权代理事务所(普通合伙) 代理人 黄海霞
地址 201306上海市浦东新区临港新片区环湖西二路888号C楼
法律状态 -

摘要

摘要 本发明提供了一种黑产网站的识别方法及系统,该方法包括:获取黑产网站样本,标记所述黑产网站样本的初始权重;根据所述黑产网站样本的内容生成SimHash的第一签名,并标记为黑产模板;提取所述黑产网站样本中的外部链接网站,根据所述外部链接网站的内容生成SimHash的第二签名;根据所述初始权重,计算得到所述黑产网站样本的权重和所述外部链接网站的权重;调整所述黑产网站样本的权重和所述外部链接网站的权重,得到目标权重;选择所述目标权重中高权重的网站,通过SimHash碰撞查找黑产网站。本发明实现对网站的分类,然后通过SimHash碰撞可精确快速的查找到黑产网站,提高了查找黑产网站的准确率和效率。