基于迁移和强化学习的移动边缘计算系统任务调度方法

基本信息

申请号 CN202010748707.6 申请日 -
公开(公告)号 CN111858009A 公开(公告)日 2020-10-30
申请公布号 CN111858009A 申请公布日 2020-10-30
分类号 G06F9/48(2006.01)I 分类 计算;推算;计数;
发明人 冷立雄;马占国;宫业国 申请(专利权)人 航天欧华信息技术有限公司
代理机构 深圳市辉泓专利代理有限公司 代理人 航天欧华信息技术有限公司
地址 518000广东省深圳市南山区桃源街道学苑大道1001号南山智园A5栋8层
法律状态 -

摘要

摘要 本发明针对边缘计算服务器的任务调度问题,提出一种基于迁移和强化学习的移动边缘计算系统任务调度方法,首先为每个服务器构建一个Actor‑Critic网络来训练它的调度策略;其中,Actor网络通过自身状态来决定动作,而Critic网络则根据所有服务器的动作和状态来评价该动作的好坏。所有服务器共享一个Critic网络。在使用多智能体强化学习训练多个边缘服务器调度策略的时候,为每个服务器的调度策略构建相同结构的策略网络。这些策略网络不仅拥有相同的网络层,并且每层的节点数目也相同。使用集中训练分散执行的机制来训练这些策略,以此来避免因为服务器数目过多而引起的维数灾难问题。