一种基于数据挖掘的多critic强化学习的电力经济调度方法

基本信息

申请号 CN202011165889.0 申请日 -
公开(公告)号 CN112381359A 公开(公告)日 2021-02-19
申请公布号 CN112381359A 申请公布日 2021-02-19
分类号 G06Q10/06(2012.01)I; 分类 计算;推算;计数;
发明人 郑旭彬;刘林鹏;刘少伟;朱建全;冯健;王斌;丁照洋;郭志龙;钟伟津 申请(专利权)人 惠州蓄能发电有限公司
代理机构 广州粤高专利商标代理有限公司 代理人 张金福
地址 516100广东省惠州市博罗县罗阳镇礤头村
法律状态 -

摘要

摘要 本发明提供一种基于数据挖掘的多critic强化学习的电力经济调度方法,包括以下步骤:S1:将电力系统多时段经济调度问题转化为马尔可夫决策过程;S2:获取电力系统历史数据,并根据马尔可夫决策过程构建多critic架构深度强化学习网络;S3:利用数据挖掘方法从历史数据中选择样本;S4:利用样本更新多critic架构深度强化学习网络的参数,得到优化的电力系统经济调度策略;S5:判断是否达到迭代结束条件;若达到,则结束迭代,得到最优的电力系统经济调度策略;若未达到,则返回步骤S3,进行下一轮迭代。本发明提供一种基于数据挖掘的多critic强化学习的电力经济调度方法,解决了目前用于求解电力系统经济调度问题的方法都存在比较大的误差的问题。