大数据异常点检测方法及其系统
基本信息
申请号 | CN201710302132.3 | 申请日 | - |
公开(公告)号 | CN107122475A | 公开(公告)日 | 2017-09-01 |
申请公布号 | CN107122475A | 申请公布日 | 2017-09-01 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 江有归;封雷;刘东升 | 申请(专利权)人 | 杭州泰一指尚科技有限公司 |
代理机构 | 北京科家知识产权代理事务所(普通合伙) | 代理人 | 杭州泰一指尚科技有限公司 |
地址 | 310051 浙江省杭州市滨江区西兴街道阡陌路482号A楼16层1601室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种大数据异常点检测方法。所述方法包括计算高维数据的维度属性权重,所述高维数据具有若干维度属性;移除所述维度属性权重低于第一预定阈值的维度属性;在所述高维数据组成的数据集中,使用标准切块划分所述数据集,获得与数据分布相关的划分结果;将所述高维数据投射到二维平面,获得与所述划分结果对应的二维平面区块;在所述二维平面区块的数据密度大于第二预定阈值时,确定为正常区块;计算不属于所述正常区块的高维数据的角度方差因子;在所述角度方差因子大于第三预定阈值时,标记所述高维数据为异常数据。本发明还公开了一种大数据异常点检测系统。解决了现有技术中数据异常点检测效果不佳的问题。 |
