爬取数据的方法、装置、介质及电子设备

基本信息

申请号 CN202110477953.7 申请日 -
公开(公告)号 CN113190735A 公开(公告)日 2021-07-30
申请公布号 CN113190735A 申请公布日 2021-07-30
分类号 G06F16/951(2019.01)I;G06F16/955(2019.01)I 分类 计算;推算;计数;
发明人 杨光;周天星 申请(专利权)人 北京精准沟通传媒科技有限公司
代理机构 - 代理人 -
地址 100089北京市海淀区西三环北路50号院8号楼8层905
法律状态 -

摘要

摘要 本发明涉及爬取数据的方法、装置、介质及电子设备。一种爬取数据的方法,包括:获取本次请求URL,根据所述本次请求URL进行数据爬取任务;获取组装后续请求所需的配置数据,后续请求配置数据包括累加参数和累加数;读取本次请求URL中包含的累加参数的参数值;将参数值与累加数相加,得到累加后的参数值;基于累加后的参数值,生成新的URL请求;将新的URL请求放入待请求队列,从而依据待请求队列中的URL请求执行爬虫任务。根据本发明的方案,不依赖于页面中的链接而生成新的URL请求,可以实现内容上连续的多个APP端请求的连续爬取,提高了APP端数据的爬取效率。