多智能体强化学习的决策方法及装置专利查询专利号|摘要-满商公司网

多智能体强化学习的决策方法及装置

基本信息

摘要

摘要	本申请提供一种多智能体强化学习的决策方法及装置。所述方法包括：获取第一智能体、第二智能体组的位置信息和动作信息；通过数据拟合模型将所述第一智能体、第二智能体组的位置信息和动作信息拟合为第一智能体‑第二智能体组的位置‑动作数据组集合；根据所述数据组集合信息并通过多智能体强化学习计算模型，计算由第一智能体与第二智能体组所组成的多智能体待配置的位置信息、动作信息；输出所述多智能体待配置的动作状态值；其中，所述第一智能体为多智能体集合中的目标智能体；所述第二智能体组为多智能体集合中第一智能体的补集。这样，可以有效提升多智能体团队及单个智能体的决策能力，且解决了因智能体数量增长带来数据空间增大的问题。