一种基于selenium的爬虫抓取方法及系统

基本信息

申请号 CN201610818690.0 申请日 -
公开(公告)号 CN106484775A 公开(公告)日 2017-03-08
申请公布号 CN106484775A 申请公布日 2017-03-08
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 周灏;王雪飞 申请(专利权)人 北京量科邦信息技术有限公司
代理机构 北京和信华成知识产权代理事务所(普通合伙) 代理人 胡剑辉
地址 100080 北京市海淀区丹棱街甲1号互联网金融中心11层1102
法律状态 -

摘要

摘要 一种基于selenium的爬虫抓取方法,其能够解决数据抓取中遇到难破解的网页/网站,并且抓取效率有所提高,开发者无需关注破解js如何加密,是否丢请求、丢参数,大大减少开发人员的工作时间和出错概率。该方法包括步骤:(1)执行初始url;(2)通过selenium驱动系统浏览器执行url地址;(3)当页面加载完毕后,获取页面进行页面数据解析。还提供了一种基于selenium的爬虫抓取系统。