一种基于强化学习的路径规划方法及装置
基本信息
申请号 | CN202011263430.4 | 申请日 | - |
公开(公告)号 | CN112507520A | 公开(公告)日 | 2021-03-16 |
申请公布号 | CN112507520A | 申请公布日 | 2021-03-16 |
分类号 | G06F30/20(2020.01)I;G06F17/15(2006.01)I;G06N20/00(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 周锐;胡文;孙佳优;叶梓豪;郭浩文 | 申请(专利权)人 | 深圳慧拓无限科技有限公司 |
代理机构 | 北京力量专利代理事务所(特殊普通合伙) | 代理人 | 毛雨田 |
地址 | 518057广东省深圳市南山区粤海街道麻岭社区深南大道9966号威盛科技大厦21层 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种基于强化学习的路径规划方法及装置,通过建立环境势能场,利用目标点的引力场和障碍物的斥力场对迭代路径的引导作用,可以加快收敛的速度,并且可以根据环境势能场优化奖励函数,从而实现奖励函数中也体现环境势能,即综合原奖励函数、目标点的引力场和障碍物的斥力场所产生的作用力的合力,来更有目的性的选取迭代路径,得到下一状态,从而在加快迭代搜索效率的同时也能够更加容易找到目标点,从而提高学习能力。 |
