一种具有多智能体的神经网络提升收敛和训练速度的方法专利查询专利号|摘要-满商公司网

一种具有多智能体的神经网络提升收敛和训练速度的方法

基本信息

摘要

摘要	本发明涉及一种具有多智能体的神经网络提升收敛和训练速度的方法、装置、可存储介质，其对多智能体的奖励做出了定向的奖励/惩罚，对于多智能体任务下的单智能体来说，当前已经作出最优决策的智能体被鼓励和保留，而作出错误决策的智能体被定向惩罚，不会影响到其他智能体的神经网络优化过程。基于此，本发明中多智能体AI在反向传播时，能够清楚地得知出错的智能体对象，从而在求导时只对这个对象做出惩罚，加快神经网络的收敛和训练速度，从而进一步提升多智能体AI的效果。