一种确定内容相似度方法和基于相似度的内容推荐方法

基本信息

申请号 CN202110779922.7 申请日 -
公开(公告)号 CN113378064A 公开(公告)日 2021-09-10
申请公布号 CN113378064A 申请公布日 2021-09-10
分类号 G06F16/9535(2019.01)I;G06F16/9536(2019.01)I;G06F40/194(2020.01)I 分类 计算;推算;计数;
发明人 黄彦华;王维堃;张雷;徐瑞文 申请(专利权)人 小红书科技有限公司
代理机构 上海华诚知识产权代理有限公司 代理人 徐颖聪
地址 200433上海市杨浦区黄兴路2005弄2号(B楼)608-4室
法律状态 -

摘要

摘要 本申请涉及计算机技术领域,公开了一种确定内容相似度方法和基于内容相似度的推荐方法,其中,该确定内容相似度的方法包括:确定第一内容和第二内容;从所述第一内容中提取第一标准特征组,以及从所述第二内容中提取第二标准特征组;确定与所述第一内容和所述第二内容关联的标签;对于所述第一标准特征组、所述第二标准特征组,进行MLP处理,得到第一向量、第二向量;以及根据所述第一向量、所述第二向量,以及所述标签,计算所述第一内容和所述第二内容的相似度。本申请解决了长尾问题,达到了在长尾的笔记和热门笔记之间建立相似关系,帮助嵌入模型从即便处于长尾的笔记中进行泛化以推断相似性的技术效果。