一种面向GPU资源的任务调度方法、装置和系统

基本信息

申请号 CN201910289968.3 申请日 -
公开(公告)号 CN109992422A 公开(公告)日 2019-07-09
申请公布号 CN109992422A 申请公布日 2019-07-09
分类号 G06F9/50(2006.01)I; G06F9/48(2006.01)I 分类 计算;推算;计数;
发明人 许欢庆; 牟永奇; 李洁; 汤劲武 申请(专利权)人 北京朗镜科技有限责任公司
代理机构 北京集佳知识产权代理有限公司 代理人 北京朗镜科技有限责任公司
地址 100026 北京市朝阳区朝阳北路225号1号楼1-4内5层
法律状态 -

摘要

摘要 本申请实施例公开了一种面向GPU资源的任务调度方法,当需要利用服务器集群中的显存资源执行任务(例如第一目标任务)时,根据第一任务请求中包括的第一目标任务的属性信息和任务资源使用配置表计算第一目标任务所需的显存资源大小,然后,根据服务器集群的可用资源状态表,确定满足第一目标任务所需的显存资源大小的GPU,以便任务执行模块利用目标GPU执行第一目标任务。本方案接收到任务请求时,会进行任务的显存资源估算,以显存资源为最小单位选取可用的GPU来完成任务,细化资源管理和任务调度的粒度。若一个GPU中显存资源符合任务要求,便可能实现一个GPU并行执行多个任务的目的,提高了GPU中显存资源的利用率。