基于Chrome插件的爬虫方法、装置、计算机设备和存储介质

基本信息

申请号 CN202110813985.X 申请日 -
公开(公告)号 CN113419781A 公开(公告)日 2021-09-21
申请公布号 CN113419781A 申请公布日 2021-09-21
分类号 G06F9/4401(2018.01)I;G06F9/445(2018.01)I;G06F16/951(2019.01)I;G06F16/957(2019.01)I 分类 计算;推算;计数;
发明人 林鹏;蔡权;黄九鸣;张圣栋;曾琰 申请(专利权)人 湖南四方天箭信息科技有限公司
代理机构 - 代理人 -
地址 410000湖南省长沙市长沙高新开发区岳麓西大道588号芯城科技园8栋1301房
法律状态 -

摘要

摘要 本发明涉及网络爬虫技术领域,提供了一种基于Chrome插件的爬虫方法、装置、计算机设备和存储介质,所述方法包括:向任务调度中心请求爬虫任务;根据所述爬虫任务请求对应的爬虫标注模板,所述爬虫标注模板预先对目标网页进行模板标注得到;启动Chrome插件,由所述Chrome插件根据所述爬虫标注模板中标注到的网页元素进行爬虫操作。采用本方法能够提高爬虫采集的工作效率。