一种信息爬取方法、装置、设备及计算机可读存储介质
基本信息
申请号 | CN201811564176.4 | 申请日 | - |
公开(公告)号 | CN109815380A | 公开(公告)日 | 2019-05-28 |
申请公布号 | CN109815380A | 申请公布日 | 2019-05-28 |
分类号 | G06F16/951(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 卢祎明; 温尚卓; 姜卓; 张青; 刘占魁; 田冬 | 申请(专利权)人 | 昆山中创软件工程有限责任公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 山东中创软件工程股份有限公司; 昆山中创软件工程有限责任公司 |
地址 | 250013 山东省济南市历下区千佛山东路41-1号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种信息爬取方法、装置、设备及计算机可读存储介质,该方法包括:从服务器后台获取需要查询的信息对应的信息要素;将所述信息要素填充到目标网页的搜索框内,并触发所述目标网页弹出验证码;从所述目标网页对应浏览器获取外界人员进行验证码对应验证得到的验证信息,如果所述验证信息表示验证通过,则将所述验证信息返回给所述服务器后台,以指示所述服务器后台运行的爬虫程序进行需查询的信息的爬取。可见,对于具有验证码的网站,本申请自动实现信息搜索及信息爬取等步骤,仅仅需要人工参与验证码对应验证,从而实现人工最小化干预,实现了半自动化的信息爬取方式,从而大大提高了信息获取速度。 |
