基于网络爬虫行为识别与缓冲更新策略的Web点击计数方法
基本信息
申请号 | CN201310567276.3 | 申请日 | - |
公开(公告)号 | CN103678492B | 公开(公告)日 | 2018-01-19 |
申请公布号 | CN103678492B | 申请公布日 | 2018-01-19 |
分类号 | G06F17/30;G06F9/44 | 分类 | 计算;推算;计数; |
发明人 | 曾剑平;罗邦慧 | 申请(专利权)人 | 深圳前海财信云科技有限公司 |
代理机构 | 上海正旦专利代理有限公司 | 代理人 | 复旦大学;深圳前海财信云科技有限公司 |
地址 | 200433 上海市杨浦区邯郸路220号 | ||
法律状态 | - |
摘要
摘要 | 本发明属于Web设计技术领域,具体为一种基于网络爬虫行为识别与缓冲更新策略的Web点击计数方法。本方法首先建立Web站点的页面组织结构的逻辑表示,综合运用客户端身份识别、Web页面逻辑结构匹配和时间属性进行爬虫行为识别,然后在设定缓冲计数结构的基础上,基于识别结果进行点击计数的更新。本方法能够正确识别爬虫点击行为,避免计数出现虚高现象,同时又能及时地进行Web真实点击计数的更新,本方法适用于各种需要进行链接或页面点击计数的应用场合。 |
