一种基于PPO和图卷积神经网络区域交叉口信号控制方法

基本信息

申请号 CN202110331958.9 申请日 -
公开(公告)号 CN113299079B 公开(公告)日 2022-06-10
申请公布号 CN113299079B 申请公布日 2022-06-10
分类号 G08G1/07(2006.01)I;G08G1/01(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 信号装置;
发明人 王昊;刘晓瀚;董长印;杨朝友 申请(专利权)人 扬州市法马智能设备有限公司
代理机构 南京经纬专利商标代理有限公司 代理人 -
地址 210000江苏省南京市玄武区四牌楼2号
法律状态 -

摘要

摘要 本发明公开了一种基于PPO和图卷积神经网络区域交叉口信号控制方法,包括以下步骤:构建交叉口协调控制区域并确立强化学习的状态、动作、奖励信息和图卷积神经网络的特征矩阵;构建区域交叉口分层信号控制模型;构建回放经验池,处理和提取训练数据和测试数据;训练区域交叉口分层信号控制模型;对区域交叉口进行统筹联合控制。本发明对控制区域建立多层信号控制模型,下层模型基于PPO算法构建多智能体控制模型;上层模型基于图卷积神经网络对各个交叉口进行统筹协调控制。本发明通过构建两层控制结构,既减少了单点控制模型的运算负担,又实现了对控制区域的总体最优控制,提高了控制区域内的车辆运行效率。