一种基于LCS的Chameleon实时日志聚类方法

基本信息

申请号 CN202010216937.8 申请日 -
公开(公告)号 CN111400500A 公开(公告)日 2020-07-10
申请公布号 CN111400500A 申请公布日 2020-07-10
分类号 G06F16/35(2019.01)I 分类 -
发明人 葛晓波;杨辰;殷传旺 申请(专利权)人 上海擎创信息技术有限公司
代理机构 北京科亿知识产权代理事务所(普通合伙) 代理人 上海擎创信息技术有限公司
地址 201203上海市浦东新区申江路5005号星创科技广场2号楼603室
法律状态 -

摘要

摘要 本发明提供一种基于LCS的Chameleon实时日志聚类方法,方法包括:第一步:分词,将原始日志处理成tokens序列,包括敏感词库提出、正则化替换、分词器分词、数值处理和过滤;第二步:日志分组;第三步:匹配模板:第四步:模板优化。本发明提供的Chameleon日志聚类算法,能够有效的帮助运维人员进行诊断以及定位问题,提高效率和解决问题的能力。