一种海量数据处理方法
基本信息
申请号 | CN202110008538.7 | 申请日 | - |
公开(公告)号 | CN112684986A | 公开(公告)日 | 2021-04-20 |
申请公布号 | CN112684986A | 申请公布日 | 2021-04-20 |
分类号 | G06F16/2455(2019.01)I;G06F16/22(2019.01)I;G06F16/27(2019.01)I;G06F16/2458(2019.01)I;G06F3/06(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 张金宝;沈党云;田野 | 申请(专利权)人 | 中交智运有限公司 |
代理机构 | 北京知呱呱知识产权代理有限公司 | 代理人 | 孙志一 |
地址 | 300210天津市河西区黑牛城道13号 | ||
法律状态 | - |
摘要
摘要 | 一种海量数据处理方法,通过确定待存储的数据粒度和数据字段,由动态扩增的列进行存储表的组织生成,将存储单元作为最细粒度的数据存储;当进行数据存储时,先将待存储的数据存入内存中作为缓存,当定义的缓存栈超过阈值后,将存入内存的数据写入文件并落入到磁盘中;数据的组成包括索引区和数据区,索引区对存储文件内部包含的数据类型进行记录,数据区对存储的数据对象进行存放;当对存储的数据读取时,先从缓存栈中查询数据;当在底层文件存储中查找数据时,先检索数据的索引区,判断底层文件是否包含该数据,若底层文件包含查找的数据则根据索引区进行数据定位。本发明解决数据查询速度慢、大量数据的冗余、过多占用存储空间的问题。 |
