一种聚类方法及装置
基本信息
申请号 | CN201110041200.8 | 申请日 | - |
公开(公告)号 | CN102646097B | 公开(公告)日 | 2019-04-26 |
申请公布号 | CN102646097B | 申请公布日 | 2019-04-26 |
分类号 | G06F16/906(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 陈建群; 杨志峰; 刘建; 贺鹏程; 崔岩; 肖战勇 | 申请(专利权)人 | 腾讯音乐(北京)有限公司 |
代理机构 | 广州三环专利商标代理有限公司 | 代理人 | 腾讯科技(深圳)有限公司;腾讯云计算(北京)有限责任公司 |
地址 | 518028 广东省深圳市福田区赛格科技园2栋东403室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种聚类方法及装置,其中,一种聚类方法包括:通过MinHash聚类模型为多个用户划分类别,存储所述MinHash聚类模型的哈希函数,以及存储所述多个用户的哈希值与所述类别的对应关系;通过所述MinHash聚类模型的哈希函数确定新用户的哈希值;根据所述哈希值与所述类别的对应关系,确定所述新用户的哈希值对应的类别。通过确定MinHash聚类模型的哈希函数以及哈希值与类别的对应关系,实现利用已有的MinHash聚类模型将新用户快速重聚类,不再需要重新生成聚类模型,提高对新用户的聚类效率。 |
