一种基于强化学习的路径规划方法及装置

基本信息

申请号 CN202011263430.4 申请日 -
公开(公告)号 CN112507520A 公开(公告)日 2021-03-16
申请公布号 CN112507520A 申请公布日 2021-03-16
分类号 G06F30/20(2020.01)I;G06F17/15(2006.01)I;G06N20/00(2019.01)I 分类 计算;推算;计数;
发明人 周锐;胡文;孙佳优;叶梓豪;郭浩文 申请(专利权)人 深圳慧拓无限科技有限公司
代理机构 北京力量专利代理事务所(特殊普通合伙) 代理人 毛雨田
地址 518057广东省深圳市南山区粤海街道麻岭社区深南大道9966号威盛科技大厦21层
法律状态 -

摘要

摘要 本发明提供了一种基于强化学习的路径规划方法及装置,通过建立环境势能场,利用目标点的引力场和障碍物的斥力场对迭代路径的引导作用,可以加快收敛的速度,并且可以根据环境势能场优化奖励函数,从而实现奖励函数中也体现环境势能,即综合原奖励函数、目标点的引力场和障碍物的斥力场所产生的作用力的合力,来更有目的性的选取迭代路径,得到下一状态,从而在加快迭代搜索效率的同时也能够更加容易找到目标点,从而提高学习能力。