一种基于纳什Q学习算法的交叉口联合信号控制方法

基本信息

申请号 CN202110623777.3 申请日 -
公开(公告)号 CN113487891B 公开(公告)日 2022-07-01
申请公布号 CN113487891B 申请公布日 2022-07-01
分类号 G08G1/081(2006.01)I;G08G1/08(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 信号装置;
发明人 王昊;刘晓瀚;董长印;杨朝友 申请(专利权)人 扬州市法马智能设备有限公司
代理机构 南京经纬专利商标代理有限公司 代理人 -
地址 210096江苏省南京市玄武区四牌楼2号
法律状态 -

摘要

摘要 本发明公开了一种基于纳什Q学习算法的交叉口联合信号控制方法,属于交通信号自适应控制技术领域,包括以下步骤:构建相邻交叉口协调控制模型并确立强化学习的状态、动作、奖励信息;构建纳什Q学习网络控制模型;获取模型训练和测试数据;训练纳什Q学习网络模型;对控制区域交叉口实施联合协同控制。本发明在基于强化学习思想实现交叉口自学习控制的基础上,考虑交叉口间存在的联系对交叉口整体区域控制效果的,在交叉口的协同博弈中实现交叉口间的纳什均衡控制。本发明通过博弈控制理论,实现相邻交叉口间的协调控制,在一定程度上缓解了因相邻交叉口缺乏合作机制而造成的拥堵问题。