基于大数据的信息数据存储整合系统及方法

基本信息

申请号 CN202011008763.2 申请日 -
公开(公告)号 CN112100469B 公开(公告)日 2021-07-27
申请公布号 CN112100469B 申请公布日 2021-07-27
分类号 G06F16/93(2019.01)I;G06F40/194(2020.01)I 分类 计算;推算;计数;
发明人 周勃;刘红霖;黄瀛;潘倩雯 申请(专利权)人 云宝宝大数据产业发展有限责任公司
代理机构 南宁东之智专利代理有限公司 代理人 严涓逢
地址 530000广西壮族自治区南宁市中国(广西)自由贸易试验区南宁片区云英路8号五象总部大厦3号楼1909号房
法律状态 -

摘要

摘要 本发明公开了一种基于大数据的信息数据存储整合系统及方法,所述整合系统包括文档信息获取模块、文档选取模块和拆分合并处理模块,所述文档信息获取模块用于获取上一个周期内待处理文件夹中各个待合并文档的文档信息,所述文档信息包括文档名称和最后修改时间,所述文档选取模块从待合并文档中选出疑似相近文档,再从疑似相近文档中筛选出相近文档,所述拆分合并处理模块对相近文档进行拆分合并处理。