一种基于纳什Q学习算法的交叉口联合信号控制方法
基本信息
申请号 | CN202110623777.3 | 申请日 | - |
公开(公告)号 | CN113487891B | 公开(公告)日 | 2022-07-01 |
申请公布号 | CN113487891B | 申请公布日 | 2022-07-01 |
分类号 | G08G1/081(2006.01)I;G08G1/08(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 信号装置; |
发明人 | 王昊;刘晓瀚;董长印;杨朝友 | 申请(专利权)人 | 扬州市法马智能设备有限公司 |
代理机构 | 南京经纬专利商标代理有限公司 | 代理人 | - |
地址 | 210096江苏省南京市玄武区四牌楼2号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于纳什Q学习算法的交叉口联合信号控制方法,属于交通信号自适应控制技术领域,包括以下步骤:构建相邻交叉口协调控制模型并确立强化学习的状态、动作、奖励信息;构建纳什Q学习网络控制模型;获取模型训练和测试数据;训练纳什Q学习网络模型;对控制区域交叉口实施联合协同控制。本发明在基于强化学习思想实现交叉口自学习控制的基础上,考虑交叉口间存在的联系对交叉口整体区域控制效果的,在交叉口的协同博弈中实现交叉口间的纳什均衡控制。本发明通过博弈控制理论,实现相邻交叉口间的协调控制,在一定程度上缓解了因相邻交叉口缺乏合作机制而造成的拥堵问题。 |
