实时数仓自动ETL方法、系统、设备及计算机存储介质

基本信息

申请号 CN202110444992.7 申请日 -
公开(公告)号 CN113220757A 公开(公告)日 2021-08-06
申请公布号 CN113220757A 申请公布日 2021-08-06
分类号 G06F16/25;G06F16/28;G06F9/54 分类 计算;推算;计数;
发明人 葛昊 申请(专利权)人 上海钢银科技发展有限公司
代理机构 - 代理人 -
地址 201900 上海市宝山区泰和路1088号6幢B区187室
法律状态 -

摘要

摘要 本申请涉及涉及电子商务平台准实时数仓建设技术领域,公开了一种实时数仓自动ETL方法、系统,实时数仓自动ETL方法,包括:数据抽取,将mysql数据库中的数据抽取至消息队列Kafka中;数据转换,基于根据用户需求预先在mysql数据库中配置的转换策略对进入消息队列Kafka中的数据进加,包括:设置默认值、数据汇总、以其他数据库的数据作为取值条件,以及上传脚本描述中的一种或多种;数据加载,基于预先在mysql数据库中配置的数据来源地和目标地的对应关系,将进加后的数据加载至标准mysql数据库。本申请通过采用上述技术方案,全程配置化所有的数据ETL需求可通过程序配置进完成,无需编写代码,简化了实时数仓的ETL过程,缩短了数据延迟。