基于强化学习与生成式对抗网络的局部交通优化方法
基本信息
申请号 | CN202110526842.0 | 申请日 | - |
公开(公告)号 | CN112991750A | 公开(公告)日 | 2021-06-18 |
申请公布号 | CN112991750A | 申请公布日 | 2021-06-18 |
分类号 | G08G1/01;G06N3/04;G06N3/08 | 分类 | 信号装置; |
发明人 | 刘新成;宣帆;肖通;徐璀;周国冬 | 申请(专利权)人 | 江苏博宇鑫信息科技股份有限公司 |
代理机构 | 苏州科仁专利代理事务所(特殊普通合伙) | 代理人 | 郭杨 |
地址 | 215000 江苏省苏州市姑苏区平泷路251号苏州城市生活广场A座35楼 | ||
法律状态 | - |
摘要
摘要 | 一种基于强化学习与生成式对抗网络的局部交通优化方法,包括建立训练模型,采用生成对抗网络自主提升模型的准确率,通过训练某个路口检测到的真实车流量数据预测指定时刻的车流量数据;采用Q学习对真实车流量数据和虚拟车流量数据进行训练输出动作形成Q值表,采用奖赏函数,得到最佳局部交通优化策略,利用强化学习交互式学习的优点,大大提升了交通信号灯周期调整的效率,由某个路口的当前拥堵级别和红绿灯信号灯时间比调整来验证拥堵情况是否有所缓解,以此往复不断优化得到最佳的红绿灯时间比,再利用生成式对抗网络的启发自博弈思想实现对Q学习的有限时间最佳训练,实现局部交通优化,最终得到最优调整方案,从而提升局部交通优化能力。 |
