一种适用于移动机械臂的强化学习奖励方法

基本信息

申请号 CN202010487548.9 申请日 -
公开(公告)号 CN111515961A 公开(公告)日 2020-08-11
申请公布号 CN111515961A 申请公布日 2020-08-11
分类号 B25J9/16(2006.01)I 分类 -
发明人 辛博;朱冰清;程旭;陈春林;马晶 申请(专利权)人 南京南欣医药技术研究院有限公司
代理机构 南京华恒专利代理事务所(普通合伙) 代理人 南京大学;南京南欣医药技术研究院有限公司
地址 210000江苏省南京市栖霞区仙林大道163号
法律状态 -

摘要

摘要 本发明公开一种适用于移动机械臂的强化学习奖励方法,包括如下步骤:S1、设计任务场景,初始化算法和移动机械臂的各项参数以及算法对应的深度网络模型;S2、重构并栅格化移动机械臂上信息采集设备发送的环境信息,明确移动机械臂的起始位置和目标位置;S3、与环境交互,收集训练数据存放于经验池;S4、从经验池中采样一个批次的数据,通过奖励函数的处理得到额外设计的反思奖励用于后续的训练;S5、结合原始奖励和额外奖励,使用深度强化学习算法训练移动机械臂在规划空间内完成目标任务;S6、记录相关训练数据和最后训练完成的模型参数,得到相对应的最优策略。