基于内容的文章推荐方法及系统

基本信息

申请号 CN201910837668.4 申请日 -
公开(公告)号 CN110727784A 公开(公告)日 2020-01-24
申请公布号 CN110727784A 申请公布日 2020-01-24
分类号 G06F16/335;G06F16/33;G06F16/35 分类 计算;推算;计数;
发明人 王苏;蔡伟杰;陈媛媛 申请(专利权)人 上海异势信息科技有限公司
代理机构 上海段和段律师事务所 代理人 李佳俊;郭国中
地址 201700上海市青浦区徐泾镇双联路158号2层F区292室
法律状态 -

摘要

摘要 本发明提供了一种基于内容的文章推荐方法及系统,包括:对文章的内容进行分词,去除无用词组,设置剩余词组的权重,将剩余的权重最高的多个词组作为所述文章的标签词组,得到文章标签向量;根据历史记录判断所述文章的标签词组之间的相关性,若相关性低于预设的阈值,则所述文章不予推荐;将用户所有有效阅读的文章的标签词组进行整合,根据时间设定标签词组的权重,阅读时间越接近的文章的标签词组的权重越高,阅读时间越长的文章的标签词组的权重越高,得到对应用户的用户标签向量;根据用户标签向量,推荐标签词组与用户标签向量命中率符合要求的文章给用户。本发明可以很好的结合文章本身的内容,过滤低质量的文章。