一种黑产网站的识别方法及系统
基本信息
申请号 | CN202111177434.5 | 申请日 | - |
公开(公告)号 | CN113923022A | 公开(公告)日 | 2022-01-11 |
申请公布号 | CN113923022A | 申请公布日 | 2022-01-11 |
分类号 | H04L9/40(2022.01)I;H04L9/32(2006.01)I;G06F16/906(2019.01)I | 分类 | 电通信技术; |
发明人 | 薛跃;凌建国;辛阳;宋轶非 | 申请(专利权)人 | 上海安恒时代信息技术有限公司 |
代理机构 | 上海恒锐佳知识产权代理事务所(普通合伙) | 代理人 | 黄海霞 |
地址 | 201306上海市浦东新区临港新片区环湖西二路888号C楼 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种黑产网站的识别方法及系统,该方法包括:获取黑产网站样本,标记所述黑产网站样本的初始权重;根据所述黑产网站样本的内容生成SimHash的第一签名,并标记为黑产模板;提取所述黑产网站样本中的外部链接网站,根据所述外部链接网站的内容生成SimHash的第二签名;根据所述初始权重,计算得到所述黑产网站样本的权重和所述外部链接网站的权重;调整所述黑产网站样本的权重和所述外部链接网站的权重,得到目标权重;选择所述目标权重中高权重的网站,通过SimHash碰撞查找黑产网站。本发明实现对网站的分类,然后通过SimHash碰撞可精确快速的查找到黑产网站,提高了查找黑产网站的准确率和效率。 |
