一种日志采集的脏数据快速检测及处理方法

基本信息

申请号 CN202210014101.9 申请日 -
公开(公告)号 CN114356908A 公开(公告)日 2022-04-15
申请公布号 CN114356908A 申请公布日 2022-04-15
分类号 G06F16/215(2019.01)I;G06F16/2458(2019.01)I;G06F16/28(2019.01)I;G06F16/22(2019.01)I;G06F9/54(2006.01)I 分类 计算;推算;计数;
发明人 黄诗贤;唐敏;张章学;蓝友枢;叶松 申请(专利权)人 福建省海峡信息技术有限公司
代理机构 福州元创专利商标代理有限公司 代理人 陈明鑫;蔡学俊
地址 350003福建省福州市鼓楼区北二环中路61号2号楼
法律状态 -

摘要

摘要 本发明涉及一种日志采集的脏数据快速检测及处理方法。包括:S1、采集各种不同网络设备类型的日志,汇聚到消息中间件;S2、依据解析库中解析规则对消息中间件中日志进行解析规则匹配,匹配成功的提取字段,并执行步骤S3;匹配不成功的认为是脏数据,并执行步骤S5;S3、依据字段分类库中的字段分类规则对提取的字段进行分类;S4、对分类完的字段,依据其对应的分类值,通过广度优先遍历,找到这个分类值的概率,同理找到相应日志下所有字段的分类值的概率,依次对各个字段的分类值的概率进行判断,只要其中一个字段的分类值的概率大于设置的阈值,就判定为脏数据;S5、将脏数据存放到脏数据库中,维护人员根据脏数据库中脏数据对规则进行重新调整。