数据挖掘中基于密度优化初始中心的K均值聚类方法

基本信息

申请号 CN201510131975.2 申请日 -
公开(公告)号 CN104731916A 公开(公告)日 2015-06-24
申请公布号 CN104731916A 申请公布日 2015-06-24
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 袁启龙;史海波;周晓锋 申请(专利权)人 无锡中科泛在信息技术研发中心有限公司
代理机构 无锡市大为专利商标事务所(普通合伙) 代理人 殷红梅;张涛
地址 214135 江苏省无锡市新区菱湖大道200号中国传感网国际创新园C座
法律状态 -

摘要

摘要 本发明涉及一种数据挖掘中基于密度优化初始中心的K均值聚类方法,其包括如下步骤:步骤1、给定所需的数据集,并确定聚类个数K;步骤2、计算数据集内所有数据对象的密度,并根据得到数据对象的密度计算数据集的平均密度;步骤3、计算数据集内每个数据对象的最小密度距离值;步骤4、对数据集内数据对象的最小密度距离值进行降序排序,根据确定的聚类个数K,选择与前K个最小密度距离值对应并且密度大于平均密度的数据对象最为初始聚类中心;步骤5、根据上述获得的初始聚类中心,利用K-means聚类方法对数据集进行聚类,直至输出聚类结果。本发明降低计算复杂度,提高分类的准确率,稳定性高,提高快速收敛。