网络爬虫系统

基本信息

申请号 CN201210495699.4 申请日 -
公开(公告)号 CN103853717B 公开(公告)日 2018-10-12
申请公布号 CN103853717B 申请公布日 2018-10-12
分类号 G06F17/30 分类 计算;推算;计数;
发明人 刘涛 申请(专利权)人 厦门新见福电子商务有限公司
代理机构 上海弼兴律师事务所 代理人 北京京东尚科信息技术有限公司;厦门新见福电子商务有限公司
地址 100195 北京市海淀区杏石口路65号西杉创意园四区11号楼东段1-4层西段1-4层
法律状态 -

摘要

摘要 本发明公开了一种网络爬虫,包括一内核以及一Ajax抓取配置,该内核以及该Ajax抓取配置均集成有htmlunit,该Ajax抓取配置用于指定一网页的地址以及该网页中的待抓取的数据,该内核用于驱动搜索引擎,并基于该Ajax抓取配置提取该待抓取的数据。本发明能够支持Ajax的执行方式抓取网页页面的数据,并且支持异步请求的技术,可以使用JavaScript向服务器提出请求并处理响应,而且不会阻塞用户。