基于Web的爬虫识别方法
基本信息
申请号 | CN201610262526.6 | 申请日 | - |
公开(公告)号 | CN105930727B | 公开(公告)日 | 2018-11-09 |
申请公布号 | CN105930727B | 申请公布日 | 2018-11-09 |
分类号 | G06F21/56;G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 李兴涛;王儒敬;王伟 | 申请(专利权)人 | 无锡中科富创科技孵化有限公司 |
代理机构 | 无锡市大为专利商标事务所(普通合伙) | 代理人 | 无锡中科富农物联科技有限公司;安徽中科物联科技有限公司;江苏物联网研究发展中心 |
地址 | 214135 江苏省无锡市新区菱湖大道200号江苏物联网研究与发展中心C座3楼 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种基于Web的爬虫识别算法,设置陷阱,并通过线上分析用户访问的行为特征判断是爬虫的概率;对于爬虫可能性大的访问者,要求验证码验证,减少误判;线下分析一天的数据通过大量数据正确的识别出隐藏性好的爬虫;对于识别出的爬虫加入到确定名单库中。本发明结合了线上的实时识别和线下的正确识别,在保证识别实时性的同时,提高了识别的准确性,降低了误判。 |
