一种基于强化学习的双聚类推荐方法和系统
基本信息
申请号 | CN201811584062.6 | 申请日 | - |
公开(公告)号 | CN109493195B | 公开(公告)日 | 2021-07-30 |
申请公布号 | CN109493195B | 申请公布日 | 2021-07-30 |
分类号 | G06Q30/06(2012.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 王丹;徐滢 | 申请(专利权)人 | 成都品果科技有限公司 |
代理机构 | 成都玖和知识产权代理事务所(普通合伙) | 代理人 | 胡琳梅 |
地址 | 610041四川省成都市中国(四川)自由贸易试验区成都高新区天府大道中段1268号1栋13层 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种基于强化学习的双聚类推荐方法和系统,属于推荐技术领域,包括步骤:S1.建立用户‑物品矩阵;S2.对所述用户‑物品矩阵进行双聚类,得到多个双聚类簇;S3.将所述双聚类簇映射到低维空间,得到状态集合;S4.根据S3得到的状态集合,通过强化学习,得到最佳状态转移序列;S5.生成推荐列表;本发明针对用户‑物品推荐场景,利用双聚类、降维以及强化学习的方法,显著提高用户‑物品场景的推荐效果,同时解决了冷启动的问题,使用户体验更好;在线情况下,当用户通过搜索或者提供地理位置和时间信息触发新的状态,可通过强化学习快速自主学习到新的推荐列表,从而更好的感知用户当前状态下的偏好,以满足用户当下需求。 |
