一种支持断点续传的数据抽取方法及系统

基本信息

申请号 CN201811076270.5 申请日 -
公开(公告)号 CN109271435B 公开(公告)日 2022-03-04
申请公布号 CN109271435B 申请公布日 2022-03-04
分类号 G06F16/25(2019.01)I;H04L67/101(2022.01)I;H04L67/1074(2022.01)I 分类 计算;推算;计数;
发明人 陈晓伟;刘春忆 申请(专利权)人 南威软件股份有限公司
代理机构 北京天盾知识产权代理有限公司 代理人 张彩珍
地址 362000福建省泉州市丰泽区丰海路南威大厦2号楼
法律状态 -

摘要

摘要 本发明属于互联网信息处理技术领域,公开了一种支持断点续传的数据抽取方法及系统,数据抽取系统包括配置数据库模块、设置模块、抽取数据模块、记录和保存模块;数据抽取方法首先根据抽取的数据来源信息配置抽取数据库,选择增量字段;然后设置开始时间、间隔时间、每次抽取最大记录数、每次调度分页抽取记录数,抽取数据;随后记录并保存流程调度次数、流程总抽取记录数、流程上次抽取记录数、当前调度抽取完成记录数、已完成分页数、总分页数,服务器故障后再次抽取从之前已完成的下一页开始抽取。本发明的数据抽取方法可避免服务器负载过大,确保服务器的稳定性,不会重复抽取已完成的数据,提高了数据抽取的效率。