基于网络爬虫行为识别与缓冲更新策略的Web点击计数方法

基本信息

申请号 CN201310567276.3 申请日 -
公开(公告)号 CN103678492B 公开(公告)日 2018-01-19
申请公布号 CN103678492B 申请公布日 2018-01-19
分类号 G06F17/30;G06F9/44 分类 计算;推算;计数;
发明人 曾剑平;罗邦慧 申请(专利权)人 深圳前海财信云科技有限公司
代理机构 上海正旦专利代理有限公司 代理人 复旦大学;深圳前海财信云科技有限公司
地址 200433 上海市杨浦区邯郸路220号
法律状态 -

摘要

摘要 本发明属于Web设计技术领域,具体为一种基于网络爬虫行为识别与缓冲更新策略的Web点击计数方法。本方法首先建立Web站点的页面组织结构的逻辑表示,综合运用客户端身份识别、Web页面逻辑结构匹配和时间属性进行爬虫行为识别,然后在设定缓冲计数结构的基础上,基于识别结果进行点击计数的更新。本方法能够正确识别爬虫点击行为,避免计数出现虚高现象,同时又能及时地进行Web真实点击计数的更新,本方法适用于各种需要进行链接或页面点击计数的应用场合。