一种大数据ETL模型执行的分支优化方法

基本信息

申请号 CN202011002885.0 申请日 -
公开(公告)号 CN112115191B 公开(公告)日 2022-02-15
申请公布号 CN112115191B 申请公布日 2022-02-15
分类号 G06F16/25(2019.01)I 分类 计算;推算;计数;
发明人 朱欣焰;郭宇达;呙维;樊亚新 申请(专利权)人 南京北斗创新应用科技研究院有限公司
代理机构 北京金智普华知识产权代理有限公司 代理人 杨采良
地址 211500江苏省南京市六合区龙池街道虎跃东路8号
法律状态 -

摘要

摘要 本发明公开了一种大数据ETL模型执行的分支优化方法,根据原始数据集的更新特点、ELT模型特点动态分析模型执行的必要性;针对ETL模型的多个算子分支进行优化判断,针对更新频率较低的分支,通过缓存表重构的方式跳过中间的重复计算过程,从算子层面降低重复执行率,提高ETL模型的执行效率,更加高效地进行大数据分析。与现有技术相比,本发明能够根据原始数据集的更新特点、ELT模型特点动态分析模型执行的必要性;针对ETL模型的多个算子分支进行优化判断,针对更新频率较低的分支,通过缓存表重构的方式跳过中间的重复计算过程,从算子层面降低重复执行率,提高ETL模型的执行效率,更加高效地进行大数据分析。