基于Chrome插件的爬虫方法、装置、计算机设备和存储介质
基本信息
申请号 | CN202110813985.X | 申请日 | - |
公开(公告)号 | CN113419781A | 公开(公告)日 | 2021-09-21 |
申请公布号 | CN113419781A | 申请公布日 | 2021-09-21 |
分类号 | G06F9/4401(2018.01)I;G06F9/445(2018.01)I;G06F16/951(2019.01)I;G06F16/957(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 林鹏;蔡权;黄九鸣;张圣栋;曾琰 | 申请(专利权)人 | 湖南四方天箭信息科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 410000湖南省长沙市长沙高新开发区岳麓西大道588号芯城科技园8栋1301房 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及网络爬虫技术领域,提供了一种基于Chrome插件的爬虫方法、装置、计算机设备和存储介质,所述方法包括:向任务调度中心请求爬虫任务;根据所述爬虫任务请求对应的爬虫标注模板,所述爬虫标注模板预先对目标网页进行模板标注得到;启动Chrome插件,由所述Chrome插件根据所述爬虫标注模板中标注到的网页元素进行爬虫操作。采用本方法能够提高爬虫采集的工作效率。 |
