一种分布式计算作业日志数据处理方法和系统
基本信息
申请号 | CN202210120296.5 | 申请日 | - |
公开(公告)号 | CN114153823A | 公开(公告)日 | 2022-03-08 |
申请公布号 | CN114153823A | 申请公布日 | 2022-03-08 |
分类号 | G06F16/21(2019.01)I;G06F16/22(2019.01)I;G06F16/2453(2019.01)I;G06F9/54(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 朱辉;张涛;薛延波;赵鹏 | 申请(专利权)人 | 北京华品博睿网络技术有限公司 |
代理机构 | 北京君泊知识产权代理有限公司 | 代理人 | 周倩 |
地址 | 100028北京市朝阳区太阳宫中路16号院1号楼18层1801内09 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种分布式计算作业日志数据处理方法和系统。该方法包括:日志标记,针对分布式计算引擎的各个计算节点,将不同计算作业应用实时产生的日志根据唯一标识进行标记;汇聚入库,将标记后的计算作业应用日志和系统日志采用消息队列采集,并根据日志标识进行日志拆分,按照一个计算作业应用对应一份日志的粒度进行实时分流,并将分流后的日志利用搜索引擎进行索引数据入库,构建计算作业应用日志的日志搜索数据库。本发明的有益效果为:通过针对实时计算作业产生的日志进行标识,区分不同的计算作业,利用高可用的日志采集方式,进行实时计算引擎的日志汇聚,并利用搜索引擎进行索引数据入库,用于日常日志搜索,提高了日志查询效率。 |
