一种基于分布式深度学习的GPU调度方法及系统
基本信息
申请号 | CN202110119238.6 | 申请日 | - |
公开(公告)号 | CN112860396A | 公开(公告)日 | 2021-05-28 |
申请公布号 | CN112860396A | 申请公布日 | 2021-05-28 |
分类号 | G06F9/48(2006.01)I;G06F9/50(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 陈光泽;陈健法;史憬烨;李剑辉 | 申请(专利权)人 | 福建紫辰信息科技有限公司 |
代理机构 | 泉州劲翔专利事务所(普通合伙) | 代理人 | 许珠珍 |
地址 | 350000福建省福州市台江区鳌峰路423号海西科技金融大厦19F | ||
法律状态 | - |
摘要
摘要 | 本发明涉及计算机技术领域,尤其涉及一种基于分布式深度学习的GPU调度方法,包括:向调度中心创建任务,任务根据优先级被依次放入任务队列中,等待被调度;调度中心周期性地从任务队列中调取任务,并根据任务所需的GPU资源,向节点选择器查询空闲的工作节点;节点选择器在复数个工作节点中查询到空闲的工作节点后,将空闲的工作节点的节点信息反馈给调度中心;调度中心将任务与节点信息组成一个综合任务信息放入任务池中;各个节点对任务池进行实时监测,当工作节点监测到任务池中存在可执行任务时,调取对应的综合任务信息以执行。有益效果:提升GPU的使用率并对任务进行有效管理,提高了深度学习的训练和测试效率。 |
