一种数据样本的聚类方法和装置

基本信息

申请号 CN201510119224.9 申请日 -
公开(公告)号 CN104765776B 公开(公告)日 2018-06-05
申请公布号 CN104765776B 申请公布日 2018-06-05
分类号 G06F17/30;G06K9/62 分类 计算;推算;计数;
发明人 徐斌;袁宏辉;陈伟祥 申请(专利权)人 南京智数云信息科技有限公司
代理机构 北京三高永信知识产权代理有限责任公司 代理人 华为技术有限公司;南京德坤信息科技有限公司;南京智数云信息科技有限公司
地址 518129 广东省深圳市龙岗区坂田华为总部办公楼
法律状态 -

摘要

摘要 本发明公开了一种数据样本的聚类方法和装置,属于计算机技术领域。所述方法包括:获取目标数据样本和各聚类类别对应的质心;根据所述目标数据样本和所述目标数据样本所属的第一聚类类别以外的其他聚类类别对应的质心,确定每个其他聚类类别的质心与所述目标数据样本的距离下限;在所述其他聚类类别对应的各质心中,选取对应的距离下限小于所述目标数据样本与所述第一聚类类别对应的质心之间的样本质心距离的质心;在选取的质心和所述第一聚类类别对应的质心中,确定与所述目标数据样本的距离最小的质心,将所述目标数据样本归入与所述目标数据样本的距离最小的质心对应的聚类类别中。采用本发明,可以节约服务器的处理资源。