一种流处理方式支持动态读取hive表数据的方法及装置
基本信息
申请号 | CN202111194393.0 | 申请日 | - |
公开(公告)号 | CN113886330A | 公开(公告)日 | 2022-01-04 |
申请公布号 | CN113886330A | 申请公布日 | 2022-01-04 |
分类号 | G06F16/13(2019.01)I;G06F16/16(2019.01)I;G06F16/182(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 赵方杨;高东升;梅纲 | 申请(专利权)人 | 武汉达梦数据库股份有限公司 |
代理机构 | 深圳市六加知识产权代理有限公司 | 代理人 | 向彬 |
地址 | 430000湖北省武汉市东湖新技术开发区高新大道999号未来科技大厦C3栋16-19层 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及计算机技术领域,提供了一种流处理方式支持动态读取hive表数据的方法及装置,方法包括:设置patitionMap和partitionValueList,设置第一轮读取中的时间戳为预设初始值;若patitionMap中能够找到partitionValueList中待读取的分区名,则判定相应待读取的分区为老分区;若老分区中待读取文件的文件修改时间大于patitionMap中相应分区中已经读取过的最大的文件修改时间,且老分区中待读取文件的文件修改时间大于当前轮时间戳,则判定老分区中待读取文件为老分区新文件,按partitionValueList中相应待读取文件的路径进行老分区新文件的读取;本发明提供的流处理方式支持动态读取hive表数据的方法可以在流机制上执行hive的数据源,使流处理引擎能够对hive中的老分区新文件进行动态读取。 |
