一种数据爬取方法和系统
基本信息
申请号 | CN201810508823.3 | 申请日 | - |
公开(公告)号 | CN108846025A | 公开(公告)日 | 2018-11-20 |
申请公布号 | CN108846025A | 申请公布日 | 2018-11-20 |
分类号 | G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 向开娓 | 申请(专利权)人 | 上海钢联电子商务股份有限公司 |
代理机构 | 北京维正专利代理有限公司 | 代理人 | 洪敏;谢绪宁 |
地址 | 201900 上海市宝山区园丰路68号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种数据爬取方法和系统,涉及数据采集技术领域,解决了现有技术爬取对象单一,数据管理不够完善,数据爬取不够系统化的缺点。该方法包括:将数据进行分类;根据采集任务对数据进行爬取;查询采集成功的指标数据结果和异常结果。通过对所要爬取的数据进行分类,根据管理员的需求设置对应的采集任务,能够提高数据的提取效率,而根据是否已采集过数据的指标来选择数据采集规则,避免了数据的重复采集和遗漏。 |
