一种聚类算法中簇数量确定方法、系统、设备及存储介质

基本信息

申请号 CN201910708100.2 申请日 -
公开(公告)号 CN110443300A 公开(公告)日 2019-11-12
申请公布号 CN110443300A 申请公布日 2019-11-12
分类号 G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 杨益军; 翟小童; 何珊珊; 付大江; 曾海林 申请(专利权)人 北京知呱呱科技服务有限公司
代理机构 北京知呱呱知识产权代理有限公司 代理人 北京知呱呱科技服务有限公司
地址 100089 北京市海淀区四季青路7号院1号楼-1至3层102东侧二层220
法律状态 -

摘要

摘要 本发明实施例公开了一种聚类算法中簇数量确定方法、系统、设备及存储介质,本发明实施例根据数据的分布特点构建出判别指数算法,通过判别指数算法建立簇数量与判别指数的关系,取判别指数最小时对应的簇数量作为确定的簇数量,克服了传统聚类算法需要手工指定或者经验指定簇数量的随意性的问题,提升了聚类的效果;与已有的考虑数据分布轮廓系数方法和肘部法相比,确定簇数量过程中更加充分地考虑了数据集数据分布的特点,使聚类效果更好。