一种适用于移动机械臂的强化学习奖励方法
基本信息
申请号 | CN202010487548.9 | 申请日 | - |
公开(公告)号 | CN111515961A | 公开(公告)日 | 2020-08-11 |
申请公布号 | CN111515961A | 申请公布日 | 2020-08-11 |
分类号 | B25J9/16(2006.01)I | 分类 | - |
发明人 | 辛博;朱冰清;程旭;陈春林;马晶 | 申请(专利权)人 | 南京南欣医药技术研究院有限公司 |
代理机构 | 南京华恒专利代理事务所(普通合伙) | 代理人 | 南京大学;南京南欣医药技术研究院有限公司 |
地址 | 210000江苏省南京市栖霞区仙林大道163号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种适用于移动机械臂的强化学习奖励方法,包括如下步骤:S1、设计任务场景,初始化算法和移动机械臂的各项参数以及算法对应的深度网络模型;S2、重构并栅格化移动机械臂上信息采集设备发送的环境信息,明确移动机械臂的起始位置和目标位置;S3、与环境交互,收集训练数据存放于经验池;S4、从经验池中采样一个批次的数据,通过奖励函数的处理得到额外设计的反思奖励用于后续的训练;S5、结合原始奖励和额外奖励,使用深度强化学习算法训练移动机械臂在规划空间内完成目标任务;S6、记录相关训练数据和最后训练完成的模型参数,得到相对应的最优策略。 |
