机器数据类别自动发现和分类的方法及装置

基本信息

申请号 CN201410674632.6 申请日 -
公开(公告)号 CN104331507A 公开(公告)日 2015-02-04
申请公布号 CN104331507A 申请公布日 2015-02-04
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 柳杨;唐玉芳;秦刚;江舟;孔祥鹏;张红意 申请(专利权)人 苏州数匠科技有限公司
代理机构 北京三友知识产权代理有限公司 代理人 北京数迅科技有限公司;北京数介科技有限公司
地址 100088 北京市西城区新街口外大街28号普天德胜A座406号
法律状态 -

摘要

摘要 本发明公开了一种机器数据类别自动发现和分类的方法及装置,其中方法包括:对机器数据的源代码进行分析,找出机器数据中的固定词汇,构建包含机器数据中固定词汇的完备字典;利用所述完备字典对机器数据进行分析,过滤掉机器数据中的可变词汇;根据过滤掉可变词汇后的机器数据中固定词汇,对机器数据进行类别自动发现和分类。采用本发明可以实现对机器数据进行类别自动发现和分类,并获取较高的分类准确率,无需人工参与,无需事先利用大量的训练样本学习分类器,还可以对机器数据流进行实时分析,自动发现机器数据中出现的新类别。