一种基于相似度的信息处理方法、装置及计算设备

基本信息

申请号 CN201710534016.4 申请日 -
公开(公告)号 CN107330672B 公开(公告)日 2021-02-26
申请公布号 CN107330672B 申请公布日 2021-02-26
分类号 G06F16/2457(2019.01)I;G06F16/28(2019.01)I;G06Q10/10(2012.01)I 分类 计算;推算;计数;
发明人 张朝阳;谢双宾;郝妙 申请(专利权)人 北京拉勾科技有限公司
代理机构 北京思睿峰知识产权代理有限公司 代理人 谢建云;赵爱军
地址 100080北京市海淀区海淀西大街70号112室
法律状态 -

摘要

摘要 本发明公开了一种基于相似度的信息处理方法、装置及计算设备,该方法包括:获取多个用户中各用户的行为日志,从行为日志中提取用户行为信息;根据各用户的用户行为信息,确定各用户的一个或更多个行为对象;对每一个用户,将其行为对象两两组合形成相应的一个或更多个行为对象集;统计各行为对象集的出现次数,将出现次数作为该行为对象集所包括的两个行为对象之间的共现频度,并根据共现频度计算对应的相似度;对每一个行为对象,从一个或更多个与其属于同一行为对象集的另一个行为对象中,选出对应的相似度最高的前第一数量个行为对象,以形成与该行为对象对应的相似对象序列。