一种GPU资源调度方法
基本信息

| 申请号 | CN202010576793.7 | 申请日 | - |
| 公开(公告)号 | CN111796932A | 公开(公告)日 | 2020-10-20 |
| 申请公布号 | CN111796932A | 申请公布日 | 2020-10-20 |
| 分类号 | G06F9/50(2006.01)I;G06F9/48(2006.01)I | 分类 | 计算;推算;计数; |
| 发明人 | 徐山川;王滨;王臣汉 | 申请(专利权)人 | 贝式计算(天津)信息技术有限公司 |
| 代理机构 | 北京卓唐知识产权代理有限公司 | 代理人 | 卜荣丽 |
| 地址 | 100027北京市朝阳区东三环北路天元港中心B1206 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明涉及通信应用技术领域,公开了一种GPU资源调度方法,包括步骤:S1、首先从集群中收集GPU的基本信息,并提供gpu‑usages接口,进入步骤S2;S2、创建GPU应用,并向Kubernetes调度器发送应用请求,进入步骤S3;S3、Kubernetes调度器在接收到该应用请求后会遍历集群中所有的GPU应用,进入步骤S4;S4、通过gpu‑usages接口计算满足该应用的调度需求的GPU,进入步骤S5;S5、GPU管理器按照应用上GPU所在机器将指定的GPU资源绑定到该应用中。实现了单个GPU在多个应用中按照GPU显存和GPU算力百分比的共享,大大提升了单个GPU的利用效率,降低了GPU应用的成本。 |





