一种Storm分布式实时计算方法及系统

基本信息

申请号 CN202111081856.2 申请日 -
公开(公告)号 CN113821407A 公开(公告)日 2021-12-21
申请公布号 CN113821407A 申请公布日 2021-12-21
分类号 G06F11/30(2006.01)I;G06F16/11(2019.01)I;G06F16/17(2019.01)I 分类 计算;推算;计数;
发明人 高春林;雷云;李建东;靳珊;刘雪松 申请(专利权)人 浙江浙大网新软件产业集团有限公司
代理机构 杭州君度专利代理事务所(特殊普通合伙) 代理人 杨天娇
地址 310000浙江省杭州市滨江区长河街道江汉路1785号网新双城大厦4幢2101-6室
法律状态 -

摘要

摘要 本发明公开了一种Storm分布式实时计算方法及系统,获取数据库日志,对数据库日志进行解析,获取行级别的变更数据,并将获取的变更数据按照统一的标准数据结构转换为标准数据,将标准数据推送至消息中间件Kafka,将标准数据对应的数据库唯一标识和变更数据在数据库日志中的位置信息注册到Kafka的zookeeper组件中。监听消息中间件Kafka,保存数据在Kafka中的偏移量,以备后续实时计算失败时恢复到当前状态。本发明基于Storm的分布式实时计算提供了“精确一次”的数据可靠性保障,使得Storm可以应用在计算准确性要求高的场景下。