一种基于Binlog+HBase+Hive的大数据同步方法和装置

基本信息

申请号 2020115454163 申请日 -
公开(公告)号 CN112286941A 公开(公告)日 2021-01-29
申请公布号 CN112286941A 申请公布日 2021-01-29
分类号 G06F16/22(2019.01)I; 分类 计算;推算;计数;
发明人 吴凡 申请(专利权)人 武汉物易云通网络科技有限公司
代理机构 深圳市六加知识产权代理有限公司 代理人 崔肖肖;向彬
地址 430000湖北省武汉市东湖新技术开发区光谷大道77号金融后台服务中心一期A3栋12层
法律状态 -

摘要

摘要 本发明涉及数据库技术领域,提供了一种基于Binlog+HBase+Hive的大数据同步方法和装置。方法包括监听关系型数据库中Binlog日志文件,获取实时变化的数据;数据同步装置获取Binlog日志文件数据后,解析并获取数据库名,表名,操作类型,主键,所有字段值;在HBase中存储Binlog日志文件数据时,对应以数据库名称作为HBase表的命名空间,建表;使用主键作为HBase数据记录的rowkey,以便于数据库记录的所有变化,都通过rowkey找到HBase的对应记录进行数据覆盖更新。本发明实时表中不保留历史全量数据,数据量小,查询实时数据速度快。