一种基于深度确定性策略梯度的自适应控制方法专利查询专利号|摘要-满商公司网

请输入想查询的关键字

查询

退出

浏览历史

清除

首页/ 沈阳航盛科技有限责任公司/ 专利详情

一种基于深度确定性策略梯度的自适应控制方法

基本信息

摘要

摘要	本发明提供了一种基于深度确定性策略梯度的自适应控制方法，依据真实系统特性构建的仿真训练环境；构建状态（观测量），回报函数，截止条件，动作；构建深度确定性策略梯度方法的critic网络、actor网络和相应的目标网络，通过与仿真训练环境的试错交互进行训练；使用actor网络训练结果作为该系统的控制器。本发明将深度强化学习方法应用于控制器设计，介绍该方法的实施步骤，通过离线仿真训练，达到控制器要求后移植到真实环境中，实现非线性系统自适应控制。