基于新闻内容和主题特征的个性化新闻推荐装置和方法

基本信息

申请号 CN201210320475.X 申请日 -
公开(公告)号 CN102831234B 公开(公告)日 2015-04-22
申请公布号 CN102831234B 申请公布日 2015-04-22
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 卢美莲;刘金亮;叶小卫;王明华;曹一鸣;李佳珊 申请(专利权)人 北京格致璞科技有限公司
代理机构 北京德琦知识产权代理有限公司 代理人 北京邮电大学;北京格致璞科技有限公司
地址 100876 北京市海淀区西土城路10号
法律状态 -

摘要

摘要 一种基于新闻内容和主题特征的个性化新闻推荐装置和方法,推荐装置设有:新闻抓取、预处理、主题模型训练、主题模型预测、用户模型构建、新闻推荐和推荐处理共七个模块。推荐方法是:利用主题模型和相关的命名实体名词序列构建个性化用户模型来表示用户阅读新闻的兴趣偏好,并对该用户的主题特征向量进行权值计算与转换以降低热门主题及新闻内容单一对用户兴趣的影响,有效解决了用户兴趣集中、且推荐结果多样性不足的缺陷。在推荐输出阶段,对初始推荐新闻列表进行处理,在现有的重复数据删除和冗余过滤的基础上,添加了基于本发明个性化用户模型的主题分组过程,并对新闻文本按照时效权值重新排序,实现准确、多样、新颖的个性化新闻推荐。