基于嵌入向量的用户标签提取方法、装置及电子设备
基本信息
申请号 | CN202210113158.4 | 申请日 | - |
公开(公告)号 | CN114139063B | 公开(公告)日 | 2022-05-17 |
申请公布号 | CN114139063B | 申请公布日 | 2022-05-17 |
分类号 | G06F16/9535(2019.01)I;G06F16/958(2019.01)I;G06F16/2458(2019.01)I;G06K9/62(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 刘平安;田昊宇 | 申请(专利权)人 | 北京淇瑀信息科技有限公司 |
代理机构 | 北京清诚知识产权代理有限公司 | 代理人 | - |
地址 | 100012北京市朝阳区双营路11号院3号楼2层4单元207 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于嵌入向量的用户标签提取方法、装置及电子设备,所述方法包括:经全量用户授权后获取全量用户设备数据的嵌入向量,生成训练数据;通过所述训练数据和多个候选聚类中心数训练对应的多个候选聚类模型;根据包含正负样本的调优数据对所述候选聚类模型进行调优处理,得到最优聚类模型;基于所述最优聚类模型对用户进行聚类,提取用户标签。本发明的最优聚类模型能够在嵌入向量之上做一层语义聚类,从而利用用户之间的向量距离,充分挖掘用户之间存在的语义相似性,对用户进行聚类,保证提取用户标签的准确性,从而避免对用户价值、意愿和风险的误判,尤其是对用户风险的误判,提高业务安全性。 |
