基于内容的文章推荐方法及系统
基本信息
申请号 | CN201910837668.4 | 申请日 | - |
公开(公告)号 | CN110727784A | 公开(公告)日 | 2020-01-24 |
申请公布号 | CN110727784A | 申请公布日 | 2020-01-24 |
分类号 | G06F16/335;G06F16/33;G06F16/35 | 分类 | 计算;推算;计数; |
发明人 | 王苏;蔡伟杰;陈媛媛 | 申请(专利权)人 | 上海异势信息科技有限公司 |
代理机构 | 上海段和段律师事务所 | 代理人 | 李佳俊;郭国中 |
地址 | 201700上海市青浦区徐泾镇双联路158号2层F区292室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于内容的文章推荐方法及系统,包括:对文章的内容进行分词,去除无用词组,设置剩余词组的权重,将剩余的权重最高的多个词组作为所述文章的标签词组,得到文章标签向量;根据历史记录判断所述文章的标签词组之间的相关性,若相关性低于预设的阈值,则所述文章不予推荐;将用户所有有效阅读的文章的标签词组进行整合,根据时间设定标签词组的权重,阅读时间越接近的文章的标签词组的权重越高,阅读时间越长的文章的标签词组的权重越高,得到对应用户的用户标签向量;根据用户标签向量,推荐标签词组与用户标签向量命中率符合要求的文章给用户。本发明可以很好的结合文章本身的内容,过滤低质量的文章。 |
