一种面向大数据空间的数据局部密度聚类方法

基本信息

申请号 CN202010469799.4 申请日 -
公开(公告)号 CN111652305A 公开(公告)日 2020-09-11
申请公布号 CN111652305A 申请公布日 2020-09-11
分类号 G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 陈晓峰;麻沁甜;刘星辰 申请(专利权)人 上海勃池信息技术有限公司
代理机构 上海骁象知识产权代理有限公司 代理人 上海勃池信息技术有限公司
地址 201815上海市嘉定区汇源路55号8幢5层517室
法律状态 -

摘要

摘要 一种面向大数据空间的数据局部密度聚类方法,包括以下步骤:预设设定密度参数和距离调节参数;计算每个数据点的局部密度值;在计算过程中寻找到数据集中的最大局部密度点;计算动态邻域半径,得到直接密度的第一个子簇;同理得到原始大数据集的各密度数据簇;根据动态邻域半径,按照各吸引点的自适应密度可达距离,进行数据集划分。本发明克服了现有技术的不足,实现了不同大小、不同形态和不同密度簇的有效聚类,从而对后续实现大数据的有效挖掘和分析提供帮助。