一种基于selenium的爬虫抓取方法及系统
基本信息
申请号 | CN201610818690.0 | 申请日 | - |
公开(公告)号 | CN106484775A | 公开(公告)日 | 2017-03-08 |
申请公布号 | CN106484775A | 申请公布日 | 2017-03-08 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 周灏;王雪飞 | 申请(专利权)人 | 北京量科邦信息技术有限公司 |
代理机构 | 北京和信华成知识产权代理事务所(普通合伙) | 代理人 | 胡剑辉 |
地址 | 100080 北京市海淀区丹棱街甲1号互联网金融中心11层1102 | ||
法律状态 | - |
摘要
摘要 | 一种基于selenium的爬虫抓取方法,其能够解决数据抓取中遇到难破解的网页/网站,并且抓取效率有所提高,开发者无需关注破解js如何加密,是否丢请求、丢参数,大大减少开发人员的工作时间和出错概率。该方法包括步骤:(1)执行初始url;(2)通过selenium驱动系统浏览器执行url地址;(3)当页面加载完毕后,获取页面进行页面数据解析。还提供了一种基于selenium的爬虫抓取系统。 |
