一种面向大数据中任意形状数据簇的快速聚类方法

基本信息

申请号 CN201710059010.6 申请日 -
公开(公告)号 CN106844692A 公开(公告)日 2017-06-13
申请公布号 CN106844692A 申请公布日 2017-06-13
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 李宗鹏;黄浩 申请(专利权)人 武汉万般上品信息技术有限公司
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 代理人 武汉万般上品信息技术有限公司
地址 430070 湖北省武汉市东湖新技术开发区光谷大道303号光谷芯中心2-07栋201-03室
法律状态 -

摘要

摘要 本发明公开了一种面向大数据中任意形状数据簇的快速聚类方法;通过对海量数据进行采样,并且对采样点的位置根据原始数据分布进行合理调整,实现在压缩数据集中数据样本数量的同时,能够有效保留原始数据集的形状信息。接下来在数据集上使用现有的任意形状聚类算法进行处理,得到最终的聚类结果。本发明能够使得在采样数据集上的聚类结果与在原始数据集上的聚类结果基本一致。相较于现有的对大数据的任意形状处理方法,本发明的方法能够在保持结果准确的前提下,极大的压缩方法的运行时间,因而比现有方法更加高效。