一种GPU资源调度方法
基本信息
申请号 | CN202010576793.7 | 申请日 | - |
公开(公告)号 | CN111796932A | 公开(公告)日 | 2020-10-20 |
申请公布号 | CN111796932A | 申请公布日 | 2020-10-20 |
分类号 | G06F9/50(2006.01)I;G06F9/48(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 徐山川;王滨;王臣汉 | 申请(专利权)人 | 贝式计算(天津)信息技术有限公司 |
代理机构 | 北京卓唐知识产权代理有限公司 | 代理人 | 卜荣丽 |
地址 | 100027北京市朝阳区东三环北路天元港中心B1206 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及通信应用技术领域,公开了一种GPU资源调度方法,包括步骤:S1、首先从集群中收集GPU的基本信息,并提供gpu‑usages接口,进入步骤S2;S2、创建GPU应用,并向Kubernetes调度器发送应用请求,进入步骤S3;S3、Kubernetes调度器在接收到该应用请求后会遍历集群中所有的GPU应用,进入步骤S4;S4、通过gpu‑usages接口计算满足该应用的调度需求的GPU,进入步骤S5;S5、GPU管理器按照应用上GPU所在机器将指定的GPU资源绑定到该应用中。实现了单个GPU在多个应用中按照GPU显存和GPU算力百分比的共享,大大提升了单个GPU的利用效率,降低了GPU应用的成本。 |
