一种大批量数据的预处理及入库的方法
基本信息
申请号 | CN201910794841.7 | 申请日 | - |
公开(公告)号 | CN110489403A | 公开(公告)日 | 2019-11-22 |
申请公布号 | CN110489403A | 申请公布日 | 2019-11-22 |
分类号 | G06F16/21(2019.01); G06F16/25(2019.01) | 分类 | 计算;推算;计数; |
发明人 | 赵伟; 康磊 | 申请(专利权)人 | 江苏华库数据技术有限公司 |
代理机构 | - | 代理人 | - |
地址 | 210000 江苏省南京市建邺区奥体大街69号1幢20层 | ||
法律状态 | - |
摘要
摘要 | 一种大批量数据的预处理及入库的方法,具体方法包括以下步骤:步骤一、第一个过程是数据预处理的过程,该过程的输入是待加载的源数据文件,输出是可以直接给第二个过程使用的集群存储层数据文件;步骤二、第二个过程是数据提交过程,即将预处理过程的输出提交到集群数据库系统中。本方法中加载的数据预处理过程不需要持有加载表的写锁,可以与加载表的其它DML并发进行;数据预处理过程相对独立,可以将数据预处理过程放置到集群资源比较空闲的节点上,实现负载均衡。 |
