机器数据类别自动发现和分类的方法及装置
基本信息
申请号 | CN201410674632.6 | 申请日 | - |
公开(公告)号 | CN104331507A | 公开(公告)日 | 2015-02-04 |
申请公布号 | CN104331507A | 申请公布日 | 2015-02-04 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 柳杨;唐玉芳;秦刚;江舟;孔祥鹏;张红意 | 申请(专利权)人 | 苏州数匠科技有限公司 |
代理机构 | 北京三友知识产权代理有限公司 | 代理人 | 北京数迅科技有限公司;北京数介科技有限公司 |
地址 | 100088 北京市西城区新街口外大街28号普天德胜A座406号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种机器数据类别自动发现和分类的方法及装置,其中方法包括:对机器数据的源代码进行分析,找出机器数据中的固定词汇,构建包含机器数据中固定词汇的完备字典;利用所述完备字典对机器数据进行分析,过滤掉机器数据中的可变词汇;根据过滤掉可变词汇后的机器数据中固定词汇,对机器数据进行类别自动发现和分类。采用本发明可以实现对机器数据进行类别自动发现和分类,并获取较高的分类准确率,无需人工参与,无需事先利用大量的训练样本学习分类器,还可以对机器数据流进行实时分析,自动发现机器数据中出现的新类别。 |
