Hive文件读写方法及装置

基本信息

申请号 CN201810593791.1 申请日 -
公开(公告)号 CN109086293B 公开(公告)日 2018-12-25
申请公布号 CN109086293B 申请公布日 2018-12-25
分类号 G06F16/13(2019.01)I;G06F16/182(2019.01)I 分类 计算;推算;计数;
发明人 吴强 申请(专利权)人 玖富数科科技集团有限责任公司
代理机构 北京正理专利代理有限公司 代理人 付生辉
地址 100000北京市朝阳区阜通东大街1号院5号楼2单元324005
法律状态 -

摘要

摘要 本发明提供了一种Hive文件读写方法及装置,包括:读取数据接入表,获取服务器信息和并行度信息;根据所述的服务器信息,生成执行程序以连接Hive文件所在的服务器;根据所述的服务器信息和并行度信息,确定所述Hive文件的读取线程数量、处理线程数量和分批大小;接入所述的Hive文件数据,进行数据消费。本发明提供的方法还包括Hive文件数据分组业务配置,组装所述读取的Hive文件数据,及根据数据消费优先级配置,确定所述数据消费的顺序。相比于传统的Hive文件读写方法,本发明提供的技术方案避免了繁冗的编译过程,缓解了读取效率较低,无法控制读取过程的问题。