一种具有多智能体的神经网络提升收敛和训练速度的方法
基本信息
申请号 | CN202110192255.2 | 申请日 | - |
公开(公告)号 | CN112819144A | 公开(公告)日 | 2021-05-18 |
申请公布号 | CN112819144A | 申请公布日 | 2021-05-18 |
分类号 | G06N3/04;G06N3/08;G06N20/00;A63F13/67 | 分类 | 计算;推算;计数; |
发明人 | 陈晨 | 申请(专利权)人 | 厦门吉比特网络技术股份有限公司 |
代理机构 | 厦门市新华专利商标代理有限公司 | 代理人 | 罗恒兰 |
地址 | 361004 福建省厦门市软件园二期望海路4号101室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种具有多智能体的神经网络提升收敛和训练速度的方法、装置、可存储介质,其对多智能体的奖励做出了定向的奖励/惩罚,对于多智能体任务下的单智能体来说,当前已经作出最优决策的智能体被鼓励和保留,而作出错误决策的智能体被定向惩罚,不会影响到其他智能体的神经网络优化过程。基于此,本发明中多智能体AI在反向传播时,能够清楚地得知出错的智能体对象,从而在求导时只对这个对象做出惩罚,加快神经网络的收敛和训练速度,从而进一步提升多智能体AI的效果。 |
