多智能体强化学习的决策方法及装置

基本信息

申请号 CN202110225976.9 申请日 -
公开(公告)号 CN112926746A 公开(公告)日 2021-06-08
申请公布号 CN112926746A 申请公布日 2021-06-08
分类号 G06N20/00 分类 计算;推算;计数;
发明人 杨明珠;刘相伟;李卓荦 申请(专利权)人 昆山小眼探索信息科技有限公司
代理机构 北京中索知识产权代理有限公司 代理人 胡大成
地址 215323 江苏省苏州市昆山市张浦镇尚明甸村村民委员会
法律状态 -

摘要

摘要 本申请提供一种多智能体强化学习的决策方法及装置。所述方法包括:获取第一智能体、第二智能体组的位置信息和动作信息;通过数据拟合模型将所述第一智能体、第二智能体组的位置信息和动作信息拟合为第一智能体‑第二智能体组的位置‑动作数据组集合;根据所述数据组集合信息并通过多智能体强化学习计算模型,计算由第一智能体与第二智能体组所组成的多智能体待配置的位置信息、动作信息;输出所述多智能体待配置的动作状态值;其中,所述第一智能体为多智能体集合中的目标智能体;所述第二智能体组为多智能体集合中第一智能体的补集。这样,可以有效提升多智能体团队及单个智能体的决策能力,且解决了因智能体数量增长带来数据空间增大的问题。