一种基于多智能体强化学习的交通组织方案优化方法

基本信息

申请号 CN202110305534.5 申请日 -
公开(公告)号 CN112949933A 公开(公告)日 2021-06-11
申请公布号 CN112949933A 申请公布日 2021-06-11
分类号 G06Q10/04;G06Q50/30;G06N3/00;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 郑皎凌;邹长杰;王茂帆;乔少杰;刘双侨 申请(专利权)人 四川易方智慧科技有限公司
代理机构 成都正华专利代理事务所(普通合伙) 代理人 李蕊
地址 610015 四川省成都市西南航空港经济开发区学府路1段24号
法律状态 -

摘要

摘要 本发明公开了一种基于多智能体强化学习的交通组织方案优化方法,改进了MADDPG中的Actor网络,基于生灭过程改进了Critic网络中的经验库,使用早高峰最大车流设作为智能体回报指标,使用轨迹数据训练最大熵逆强化学习模型作为多智能体的回报机制,基于此设计出强化学习的回报函数;本发明方法实现了对当前城市交通组织方案进行优化,通过对当前交通数据进行分析,找出导致交通拥堵的原因,本方法能够很好的适应和快速找出最优方案,为交警专家提供了交通辅导意见,并为智慧城市打下基础。