数据挖掘中基于密度的K中心点划分聚类方法

基本信息

申请号 CN201510208624.7 申请日 -
公开(公告)号 CN104765879A 公开(公告)日 2015-07-08
申请公布号 CN104765879A 申请公布日 2015-07-08
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 袁启龙;史海波;周晓锋 申请(专利权)人 无锡中科泛在信息技术研发中心有限公司
代理机构 无锡市大为专利商标事务所(普通合伙) 代理人 殷红梅;张涛
地址 214135 江苏省无锡市新区菱湖大道200号中国传感网国际创新园C座
法律状态 -

摘要

摘要 本发明涉及一种数据挖掘中基于密度的K中心点划分聚类方法,其包括如下步骤:步骤1、给定所需的数据集,并确定聚类个数K;步骤2、计算数据对象的密度及平均密度;步骤3、计算数据集内每个数据对象的最小密度距离值;步骤4、对数据集内数据对象的最小密度距离值进行降序排序,根据确定的聚类个数K,从大到小选择K个与最小密度距离值对应并且密度大于平均密度的数据对象作为聚类中心;步骤5、将数据集内的数据对象分配到与所述数据对象距离最近的初始聚类中心,得到聚类结果。本发明能够选出高质量的中心点,而不需要像K均值算法中的后续迭代更新步骤,其降低计算复杂度,提高分类的准确率,稳定性高,提高运算效率。