基于浏览器的数据获取方法、装置和系统

基本信息

申请号 CN202110965104.6 申请日 -
公开(公告)号 CN113742550A 公开(公告)日 2021-12-03
申请公布号 CN113742550A 申请公布日 2021-12-03
分类号 G06F16/951(2019.01)I;G06F16/958(2019.01)I;G06F8/30(2018.01)I 分类 计算;推算;计数;
发明人 揭鹏;万友先;李文辉;张鑫;陈帅 申请(专利权)人 广州市易工品科技有限公司
代理机构 广州智斧知识产权代理事务所(普通合伙) 代理人 孔德超
地址 510000广东省广州市海珠区阅江中路686号410
法律状态 -

摘要

摘要 本发明实施例涉及信息获取技术领域,公开了一种基于浏览器的数据获取方法、装置和系统。该方法包括:使用WebKit创建浏览器,并编写自动化js脚本,存储到目标文件夹目录中;接收目标任务,并基于所述目标任务使所述浏览器跳转至目标页面;根据所述目标任务调取目标js脚本获取第一数据;对所述第一数据进行解析和清洗,得到目标数据并入库;返回目标任务结果状态。实施本发明实施例,可以通过自制WebKit浏览器以及自动化js脚本,快速自动爬取相关数据。