一种数据爬取方法、系统及设备

基本信息

申请号 CN202010218979.5 申请日 -
公开(公告)号 CN111538883A 公开(公告)日 2020-08-14
申请公布号 CN111538883A 申请公布日 2020-08-14
分类号 G06F16/951(2019.01)I;G06F16/955(2019.01)I 分类 -
发明人 毛卫南;苗润莲;毛维娜;张敏;向宁;张洪元 申请(专利权)人 北京市科学技术情报研究所
代理机构 北京知呱呱知识产权代理有限公司 代理人 北京市科学技术情报研究所
地址 100044北京市西城区西外大街140号首建金融中心10层
法律状态 -

摘要

摘要 本发明实施例公开了一种数据爬取方法、系统及设备,涉及网络信息处理技术领域,通过流程控制数据爬取代理IP地址更换来进行数据爬取,相比于常规的代理IP爬取技术,可以大规模频繁更换数据爬取代理IP地址访问目标网页,更适合于目标网页对登入后数据获取连续性要求大的情况,解决了更换爬取代理IP地址导致数据获取出现中断的问题,最大限度的保留了数据的连续性,大大减少了后期数据处理上的复杂度,增加了数据爬取效率。