一种聚类方法及装置

基本信息

申请号 CN201110041200.8 申请日 -
公开(公告)号 CN102646097B 公开(公告)日 2019-04-26
申请公布号 CN102646097B 申请公布日 2019-04-26
分类号 G06F16/906(2019.01)I 分类 计算;推算;计数;
发明人 陈建群; 杨志峰; 刘建; 贺鹏程; 崔岩; 肖战勇 申请(专利权)人 腾讯音乐(北京)有限公司
代理机构 广州三环专利商标代理有限公司 代理人 腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司
地址 518028 广东省深圳市福田区赛格科技园2栋东403室
法律状态 -

摘要

摘要 本发明公开了一种聚类方法及装置,其中,一种聚类方法包括:通过MinHash聚类模型为多个用户划分类别,存储所述MinHash聚类模型的哈希函数,以及存储所述多个用户的哈希值与所述类别的对应关系;通过所述MinHash聚类模型的哈希函数确定新用户的哈希值;根据所述哈希值与所述类别的对应关系,确定所述新用户的哈希值对应的类别。通过确定MinHash聚类模型的哈希函数以及哈希值与类别的对应关系,实现利用已有的MinHash聚类模型将新用户快速重聚类,不再需要重新生成聚类模型,提高对新用户的聚类效率。