一种基于PPO和图卷积神经网络区域交叉口信号控制方法
基本信息
申请号 | CN202110331958.9 | 申请日 | - |
公开(公告)号 | CN113299079B | 公开(公告)日 | 2022-06-10 |
申请公布号 | CN113299079B | 申请公布日 | 2022-06-10 |
分类号 | G08G1/07(2006.01)I;G08G1/01(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 信号装置; |
发明人 | 王昊;刘晓瀚;董长印;杨朝友 | 申请(专利权)人 | 扬州市法马智能设备有限公司 |
代理机构 | 南京经纬专利商标代理有限公司 | 代理人 | - |
地址 | 210000江苏省南京市玄武区四牌楼2号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于PPO和图卷积神经网络区域交叉口信号控制方法,包括以下步骤:构建交叉口协调控制区域并确立强化学习的状态、动作、奖励信息和图卷积神经网络的特征矩阵;构建区域交叉口分层信号控制模型;构建回放经验池,处理和提取训练数据和测试数据;训练区域交叉口分层信号控制模型;对区域交叉口进行统筹联合控制。本发明对控制区域建立多层信号控制模型,下层模型基于PPO算法构建多智能体控制模型;上层模型基于图卷积神经网络对各个交叉口进行统筹协调控制。本发明通过构建两层控制结构,既减少了单点控制模型的运算负担,又实现了对控制区域的总体最优控制,提高了控制区域内的车辆运行效率。 |
