一种基于CUDA的GPU资源调度系统和方法

基本信息

申请号 CN201910724239.6 申请日 -
公开(公告)号 CN110471766A 公开(公告)日 2019-11-19
申请公布号 CN110471766A 申请公布日 2019-11-19
分类号 G06F9/50(2006.01)I; G06T1/20(2006.01)I 分类 计算;推算;计数;
发明人 苏斌 申请(专利权)人 北京华恒盛世科技有限公司
代理机构 北京科亿知识产权代理事务所(普通合伙) 代理人 北京华恒盛世科技有限公司
地址 100013 北京市东城区和平里东街雍和航星科技园37号楼211室
法律状态 -

摘要

摘要 本发明公开了一种基于CUDA的GPU资源调度系统,管理节点和系统用户,所述系统用户通过提交作业模块连接到管理节点,所述管理节点通过派发作业模块连接有IBM Power计算节点和NVDIA DGX计算节点。本发明针对不同类型的应用采用不同的GPU特性,提高整个系统中GPU的利用率,加速应用在GPU中的运行效率。系统可以针对应用需求,动态切换GPU模式,根据应用需要选择最适合应用的GPU类型及其需要的GPU Factor,同一用户多个应用可通过GPU MPS以独占的方式共享使用GPU,提高GPU利用率,支持IBM Power和NVIDIA DGX两种GPU NVLINK拓扑,将应用分配到带有NVLINK互联的GPU上,通过把当前GPU的主要特性应用于资源调度系统中,提高了这个系统的GPU资源利用率以及应用的运行效率。