基于浏览器的数据获取方法、装置和系统
基本信息
申请号 | CN202110965104.6 | 申请日 | - |
公开(公告)号 | CN113742550A | 公开(公告)日 | 2021-12-03 |
申请公布号 | CN113742550A | 申请公布日 | 2021-12-03 |
分类号 | G06F16/951(2019.01)I;G06F16/958(2019.01)I;G06F8/30(2018.01)I | 分类 | 计算;推算;计数; |
发明人 | 揭鹏;万友先;李文辉;张鑫;陈帅 | 申请(专利权)人 | 广州市易工品科技有限公司 |
代理机构 | 广州智斧知识产权代理事务所(普通合伙) | 代理人 | 孔德超 |
地址 | 510000广东省广州市海珠区阅江中路686号410 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例涉及信息获取技术领域,公开了一种基于浏览器的数据获取方法、装置和系统。该方法包括:使用WebKit创建浏览器,并编写自动化js脚本,存储到目标文件夹目录中;接收目标任务,并基于所述目标任务使所述浏览器跳转至目标页面;根据所述目标任务调取目标js脚本获取第一数据;对所述第一数据进行解析和清洗,得到目标数据并入库;返回目标任务结果状态。实施本发明实施例,可以通过自制WebKit浏览器以及自动化js脚本,快速自动爬取相关数据。 |
