一种适用于移动机械臂的强化学习奖励方法专利查询专利号|摘要-满商公司网

一种适用于移动机械臂的强化学习奖励方法

基本信息

摘要

摘要	本发明公开一种适用于移动机械臂的强化学习奖励方法，包括如下步骤：S1、设计任务场景，初始化算法和移动机械臂的各项参数以及算法对应的深度网络模型；S2、重构并栅格化移动机械臂上信息采集设备发送的环境信息，明确移动机械臂的起始位置和目标位置；S3、与环境交互，收集训练数据存放于经验池；S4、从经验池中采样一个批次的数据，通过奖励函数的处理得到额外设计的反思奖励用于后续的训练；S5、结合原始奖励和额外奖励，使用深度强化学习算法训练移动机械臂在规划空间内完成目标任务；S6、记录相关训练数据和最后训练完成的模型参数，得到相对应的最优策略。