一种基于多智能体强化学习的交通组织方案优化方法
基本信息
申请号 | CN202110305534.5 | 申请日 | - |
公开(公告)号 | CN112949933A | 公开(公告)日 | 2021-06-11 |
申请公布号 | CN112949933A | 申请公布日 | 2021-06-11 |
分类号 | G06Q10/04;G06Q50/30;G06N3/00;G06N3/04;G06N3/08 | 分类 | 计算;推算;计数; |
发明人 | 郑皎凌;邹长杰;王茂帆;乔少杰;刘双侨 | 申请(专利权)人 | 四川易方智慧科技有限公司 |
代理机构 | 成都正华专利代理事务所(普通合伙) | 代理人 | 李蕊 |
地址 | 610015 四川省成都市西南航空港经济开发区学府路1段24号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于多智能体强化学习的交通组织方案优化方法,改进了MADDPG中的Actor网络,基于生灭过程改进了Critic网络中的经验库,使用早高峰最大车流设作为智能体回报指标,使用轨迹数据训练最大熵逆强化学习模型作为多智能体的回报机制,基于此设计出强化学习的回报函数;本发明方法实现了对当前城市交通组织方案进行优化,通过对当前交通数据进行分析,找出导致交通拥堵的原因,本方法能够很好的适应和快速找出最优方案,为交警专家提供了交通辅导意见,并为智慧城市打下基础。 |
