具有多门专家混合软演员评论家的视频推荐

基本信息

申请号 CN202080005171.7 申请日 -
公开(公告)号 CN114190102A 公开(公告)日 2022-03-15
申请公布号 CN114190102A 申请公布日 2022-03-15
分类号 G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06F16/70(2006.01)I;G06F16/957(2006.01)I 分类 计算;推算;计数;
发明人 李定成;李旭;王君;李平 申请(专利权)人 百度时代网络技术(北京)有限公司
代理机构 北京英赛嘉华知识产权代理有限责任公司 代理人 王达佐;王艳春
地址 100080北京市海淀区东北旺西路8号中关村软件园17号楼二层A2
法律状态 -

摘要

摘要 本文中描述了基于强化学习的大规模多目标排序系统的实施方式。本系统的实施方式可用于优化视频共享平台上的短视频推荐。用户反馈中的多重竞争排序目标和隐式选择偏差是现实世界平台中的主要挑战。为了解决这些挑战,将多门专家混合(MMoE)和软演员评论家(SAC)一起集成为MMoE_SAC系统。实验结果表明,与仅基于单个策略的系统相比,MMoE_SAC系统的实施方式可大大降低损失函数。