基于大数据的信息数据存储整合系统及方法

基本信息

申请号 CN202011008763.2 申请日 -
公开(公告)号 CN112100469A 公开(公告)日 2020-12-18
申请公布号 CN112100469A 申请公布日 2020-12-18
分类号 G06F16/93;G06F40/194 分类 计算;推算;计数;
发明人 潘倩雯 申请(专利权)人 云宝宝大数据产业发展有限责任公司
代理机构 北京华际知识产权代理有限公司 代理人 黄永兰
地址 215000 江苏省苏州市高新区鸿禧路471号
法律状态 -

摘要

摘要 本发明公开了一种基于大数据的信息数据存储整合系统及方法,所述整合系统包括文档信息获取模块、文档选取模块和拆分合并处理模块,所述文档信息获取模块用于获取上一个周期内待处理文件夹中各个待合并文档的文档信息,所述文档信息包括文档名称和最后修改时间,所述文档选取模块从待合并文档中选出疑似相近文档,再从疑似相近文档中筛选出相近文档,所述拆分合并处理模块对相近文档进行拆分合并处理。