基于强化学习的多路口交通灯控制方法、系统及存储介质

基本信息

申请号 CN202110324649.9 申请日 -
公开(公告)号 CN113223305A 公开(公告)日 2021-08-06
申请公布号 CN113223305A 申请公布日 2021-08-06
分类号 G08G1/08(2006.01)I;G08G1/081(2006.01)I;G06N20/00(2019.01)I 分类 信号装置;
发明人 王斌;甘海洋;盛津芳;康文军 申请(专利权)人 禾麦科技开发(深圳)有限公司
代理机构 长沙朕扬知识产权代理事务所(普通合伙) 代理人 邓宇
地址 410083湖南省长沙市麓山南路932号
法律状态 -

摘要

摘要 本发明公开了基于强化学习的多路口交通灯控制方法、系统及存储介质,通过构建并训练以MADDPG为框架,以多路口交通灯系统控制的多个路口的车流数据作为输入状态,以输入状态对应的信号灯的时序调控动作为输出动作,以t时刻的历史输入状态、历史输入状态对应的历史输出动作、历史输出动作对应的奖赏值、t+1时刻的历史输入状态以及t时刻的历史输入状态对应的历史输出动作平均值作为训练样本的多智能体强化模型,并基于多智能体强化模型获取多路口交通灯系统的最优控制动作,相比现有技术,该方法在训练时将智能体之间的相互影响简化为动作平均值,极大地简化了智能体数量带来的模型空间的增大,能有效缩短解算时间。