基于深度强化学习的自动驾驶行为决策方法
基本信息
申请号 | CN202010381846.X | 申请日 | - |
公开(公告)号 | CN111605565A | 公开(公告)日 | 2020-09-01 |
申请公布号 | CN111605565A | 申请公布日 | 2020-09-01 |
分类号 | B60W60/00(2020.01)I | 分类 | 一般车辆; |
发明人 | 杨明珠;刘相伟;李卓荦 | 申请(专利权)人 | 昆山小眼探索信息科技有限公司 |
代理机构 | 北京中索知识产权代理有限公司 | 代理人 | 胡大成 |
地址 | 215323江苏省苏州市昆山市张浦镇尚明甸村村民委员会 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了基于深度强化学习的自动驾驶行为决策方法,包括:获取自动驾驶车辆周围的当前环境状态;根据输入的当前环境状态和自动驾驶车辆的当前行为状态,在经验池中选择并输出自动驾驶车辆的动作行为,如果经验池中没有与当前环境状态对应的动作行为,则由深度强化学习结构计算并输出自动驾驶车辆的动作行为。本发明的获取当前环境状态采用RGB摄像头、红外摄像头和固态激光雷达,减少了传感器的使用。通过模仿学习人类驾驶员的驾驶经验形成经验池,使得自动驾驶车辆更接近人类的驾驶习惯,有利于解决有人车和无人车在路上并存的问题,更重要的是提升了安全性。 |
