一种基于分布式深度学习的GPU调度方法及系统

基本信息

申请号 CN202110119238.6 申请日 -
公开(公告)号 CN112860396A 公开(公告)日 2021-05-28
申请公布号 CN112860396A 申请公布日 2021-05-28
分类号 G06F9/48(2006.01)I;G06F9/50(2006.01)I 分类 计算;推算;计数;
发明人 陈光泽;陈健法;史憬烨;李剑辉 申请(专利权)人 福建紫辰信息科技有限公司
代理机构 泉州劲翔专利事务所(普通合伙) 代理人 许珠珍
地址 350000福建省福州市台江区鳌峰路423号海西科技金融大厦19F
法律状态 -

摘要

摘要 本发明涉及计算机技术领域,尤其涉及一种基于分布式深度学习的GPU调度方法,包括:向调度中心创建任务,任务根据优先级被依次放入任务队列中,等待被调度;调度中心周期性地从任务队列中调取任务,并根据任务所需的GPU资源,向节点选择器查询空闲的工作节点;节点选择器在复数个工作节点中查询到空闲的工作节点后,将空闲的工作节点的节点信息反馈给调度中心;调度中心将任务与节点信息组成一个综合任务信息放入任务池中;各个节点对任务池进行实时监测,当工作节点监测到任务池中存在可执行任务时,调取对应的综合任务信息以执行。有益效果:提升GPU的使用率并对任务进行有效管理,提高了深度学习的训练和测试效率。