一种数据爬取方法和系统
基本信息

| 申请号 | CN201810508823.3 | 申请日 | - |
| 公开(公告)号 | CN108846025A | 公开(公告)日 | 2018-11-20 |
| 申请公布号 | CN108846025A | 申请公布日 | 2018-11-20 |
| 分类号 | G06F17/30 | 分类 | 计算;推算;计数; |
| 发明人 | 向开娓 | 申请(专利权)人 | 上海钢联电子商务股份有限公司 |
| 代理机构 | 北京维正专利代理有限公司 | 代理人 | 洪敏;谢绪宁 |
| 地址 | 201900 上海市宝山区园丰路68号 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明公开了一种数据爬取方法和系统,涉及数据采集技术领域,解决了现有技术爬取对象单一,数据管理不够完善,数据爬取不够系统化的缺点。该方法包括:将数据进行分类;根据采集任务对数据进行爬取;查询采集成功的指标数据结果和异常结果。通过对所要爬取的数据进行分类,根据管理员的需求设置对应的采集任务,能够提高数据的提取效率,而根据是否已采集过数据的指标来选择数据采集规则,避免了数据的重复采集和遗漏。 |





