大数据异常点检测方法及其系统

基本信息

申请号 CN201710302132.3 申请日 -
公开(公告)号 CN107122475A 公开(公告)日 2017-09-01
申请公布号 CN107122475A 申请公布日 2017-09-01
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 江有归;封雷;刘东升 申请(专利权)人 杭州泰一指尚科技有限公司
代理机构 北京科家知识产权代理事务所(普通合伙) 代理人 杭州泰一指尚科技有限公司
地址 310051 浙江省杭州市滨江区西兴街道阡陌路482号A楼16层1601室
法律状态 -

摘要

摘要 本发明公开了一种大数据异常点检测方法。所述方法包括计算高维数据的维度属性权重,所述高维数据具有若干维度属性;移除所述维度属性权重低于第一预定阈值的维度属性;在所述高维数据组成的数据集中,使用标准切块划分所述数据集,获得与数据分布相关的划分结果;将所述高维数据投射到二维平面,获得与所述划分结果对应的二维平面区块;在所述二维平面区块的数据密度大于第二预定阈值时,确定为正常区块;计算不属于所述正常区块的高维数据的角度方差因子;在所述角度方差因子大于第三预定阈值时,标记所述高维数据为异常数据。本发明还公开了一种大数据异常点检测系统。解决了现有技术中数据异常点检测效果不佳的问题。