机器数据类别自动发现和分类的方法及装置
基本信息
申请号 | CN201410674632.6 | 申请日 | - |
公开(公告)号 | CN104331507B | 公开(公告)日 | 2018-04-27 |
申请公布号 | CN104331507B | 申请公布日 | 2018-04-27 |
分类号 | G06F17/30 | 分类 | 计算;推算;计数; |
发明人 | 柳杨;唐玉芳;秦刚;江舟;孔祥鹏;张红意 | 申请(专利权)人 | 苏州数匠科技有限公司 |
代理机构 | 北京三友知识产权代理有限公司 | 代理人 | 北京数介科技有限公司 |
地址 | 101111 北京市西城区新街口外大街28号A座408号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种机器数据类别自动发现和分类的方法及装置,其中方法包括:对机器数据的源代码进行分析,找出机器数据中的固定词汇,构建包含机器数据中固定词汇的完备字典;利用所述完备字典对机器数据进行分析,过滤掉机器数据中的可变词汇;根据过滤掉可变词汇后的机器数据中固定词汇,对机器数据进行类别自动发现和分类。采用本发明可以实现对机器数据进行类别自动发现和分类,并获取较高的分类准确率,无需人工参与,无需事先利用大量的训练样本学习分类器,还可以对机器数据流进行实时分析,自动发现机器数据中出现的新类别。 |
