基于迁移和强化学习的移动边缘计算系统任务调度方法
基本信息
申请号 | CN202010748707.6 | 申请日 | - |
公开(公告)号 | CN111858009A | 公开(公告)日 | 2020-10-30 |
申请公布号 | CN111858009A | 申请公布日 | 2020-10-30 |
分类号 | G06F9/48(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 冷立雄;马占国;宫业国 | 申请(专利权)人 | 航天欧华信息技术有限公司 |
代理机构 | 深圳市辉泓专利代理有限公司 | 代理人 | 航天欧华信息技术有限公司 |
地址 | 518000广东省深圳市南山区桃源街道学苑大道1001号南山智园A5栋8层 | ||
法律状态 | - |
摘要
摘要 | 本发明针对边缘计算服务器的任务调度问题,提出一种基于迁移和强化学习的移动边缘计算系统任务调度方法,首先为每个服务器构建一个Actor‑Critic网络来训练它的调度策略;其中,Actor网络通过自身状态来决定动作,而Critic网络则根据所有服务器的动作和状态来评价该动作的好坏。所有服务器共享一个Critic网络。在使用多智能体强化学习训练多个边缘服务器调度策略的时候,为每个服务器的调度策略构建相同结构的策略网络。这些策略网络不仅拥有相同的网络层,并且每层的节点数目也相同。使用集中训练分散执行的机制来训练这些策略,以此来避免因为服务器数目过多而引起的维数灾难问题。 |
