基于深度强化学习的网络能耗与吞吐量联合优化路由方法
基本信息
申请号 | CN202210437000.2 | 申请日 | - |
公开(公告)号 | CN114710439A | 公开(公告)日 | 2022-07-05 |
申请公布号 | CN114710439A | 申请公布日 | 2022-07-05 |
分类号 | H04L45/12(2022.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I;G06F17/11(2006.01)I | 分类 | 电通信技术; |
发明人 | 叶彬彬;罗威;李洋;丁忠林;吕超;蔡万升 | 申请(专利权)人 | 南京南瑞信息通信科技有限公司 |
代理机构 | 南京纵横知识产权代理有限公司 | 代理人 | - |
地址 | 210003江苏省南京市鼓楼区南瑞路8号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于深度强化学习的网络能耗与吞吐量联合优化路由方法,首先将数据中心网络的路由调度描述为具有两个目标的混合整数非线性规划问题,即最大化网络吞吐量和最小化能量消耗;其次为深度强化学习算法生成大量的训练数据,主要包括当前网络状态、决策行为、奖励和新网络状态;最后选择卷积神经网络和全连接神经网络作为智能体,并使用训练数据对智能体进行训练操作,其核心理论是选择贝尔曼方程来评估每个行为的结果、定义贝尔曼误差为损失函数,通过梯度下降法来对其进行优化,直至收敛。本发明提供的方法适用于大规模、高动态性的数据中心网络,相较于其他方案(如帕累托最优)具备效率高和成本低的优点。 |
