一种流处理方式支持动态读取hive表数据的方法及装置

基本信息

申请号 CN202111194393.0 申请日 -
公开(公告)号 CN113886330A 公开(公告)日 2022-01-04
申请公布号 CN113886330A 申请公布日 2022-01-04
分类号 G06F16/13(2019.01)I;G06F16/16(2019.01)I;G06F16/182(2019.01)I 分类 计算;推算;计数;
发明人 赵方杨;高东升;梅纲 申请(专利权)人 武汉达梦数据库股份有限公司
代理机构 深圳市六加知识产权代理有限公司 代理人 向彬
地址 430000湖北省武汉市东湖新技术开发区高新大道999号未来科技大厦C3栋16-19层
法律状态 -

摘要

摘要 本发明涉及计算机技术领域,提供了一种流处理方式支持动态读取hive表数据的方法及装置,方法包括:设置patitionMap和partitionValueList,设置第一轮读取中的时间戳为预设初始值;若patitionMap中能够找到partitionValueList中待读取的分区名,则判定相应待读取的分区为老分区;若老分区中待读取文件的文件修改时间大于patitionMap中相应分区中已经读取过的最大的文件修改时间,且老分区中待读取文件的文件修改时间大于当前轮时间戳,则判定老分区中待读取文件为老分区新文件,按partitionValueList中相应待读取文件的路径进行老分区新文件的读取;本发明提供的流处理方式支持动态读取hive表数据的方法可以在流机制上执行hive的数据源,使流处理引擎能够对hive中的老分区新文件进行动态读取。