异常数据检测方法和装置

基本信息

申请号 CN201710145015.0 申请日 -
公开(公告)号 CN107122394B 公开(公告)日 2020-02-14
申请公布号 CN107122394B 申请公布日 2020-02-14
分类号 G06F16/35;G06N5/02 分类 计算;推算;计数;
发明人 李刚毅;赵小光;于坤元;刘刚 申请(专利权)人 博彦科技股份有限公司
代理机构 北京康信知识产权代理有限责任公司 代理人 韩建伟;张永明
地址 100193 北京市海淀区西北旺东路10号院东区7号楼(博彦科技大厦)
法律状态 -

摘要

摘要 本发明公开了一种异常数据检测方法和装置。其中,该方法包括:获取文本;从所述文本中提取多条数据,其中,所述多条数据中的每一条数据均由多个属性值构成,每个属性值对应该数据的一个属性,所述每一条数据的属性均相同;对所述每一条数据的属性值进行汇合得到所述每一条数据的新属性值,其中,所述每一条数据的新属性值的个数小于汇合之前的所述每一条数据的属性值的个数;使用所述每一条数据的新属性值进行机器学习得到数据模型,其中,所述数据模型用于区分从文本中提取的数据是否为异常数据。通过本发明解决了现有技术中所存在的用于培训的数据维度大导致的问题,提高培训效率的同时提高了培训结果的准确度。