基于深度强化学习的自动驾驶行为决策方法

基本信息

申请号 CN202010381846.X 申请日 -
公开(公告)号 CN111605565A 公开(公告)日 2020-09-01
申请公布号 CN111605565A 申请公布日 2020-09-01
分类号 B60W60/00(2020.01)I 分类 一般车辆;
发明人 杨明珠;刘相伟;李卓荦 申请(专利权)人 昆山小眼探索信息科技有限公司
代理机构 北京中索知识产权代理有限公司 代理人 胡大成
地址 215323江苏省苏州市昆山市张浦镇尚明甸村村民委员会
法律状态 -

摘要

摘要 本发明公开了基于深度强化学习的自动驾驶行为决策方法,包括:获取自动驾驶车辆周围的当前环境状态;根据输入的当前环境状态和自动驾驶车辆的当前行为状态,在经验池中选择并输出自动驾驶车辆的动作行为,如果经验池中没有与当前环境状态对应的动作行为,则由深度强化学习结构计算并输出自动驾驶车辆的动作行为。本发明的获取当前环境状态采用RGB摄像头、红外摄像头和固态激光雷达,减少了传感器的使用。通过模仿学习人类驾驶员的驾驶经验形成经验池,使得自动驾驶车辆更接近人类的驾驶习惯,有利于解决有人车和无人车在路上并存的问题,更重要的是提升了安全性。