提供GPU服务的方法及系统

基本信息

申请号 CN201910816173.3 申请日 -
公开(公告)号 CN110532098B 公开(公告)日 2022-03-08
申请公布号 CN110532098B 申请公布日 2022-03-08
分类号 G06F9/50(2006.01)I;G06T1/20(2006.01)I 分类 计算;推算;计数;
发明人 谢盈 申请(专利权)人 广东星舆科技有限公司
代理机构 佛山帮专知识产权代理事务所(普通合伙) 代理人 曾凤云
地址 510000广东省广州市天河区平云路163号广电科技大厦301(部位:自编05单元)
法律状态 -

摘要

摘要 本公开涉及深度学习服务的技术领域,公开了一种提供GPU服务的方法及系统,方法包括以下步骤:在容器集群管理系统中启动容器;读取配置信息并根据所述配置信息加载容器中的推理服务端;接收客户端的请求信息,根据所述请求信息向所述推理服务端发送计算指令,所述计算指令用于指示所述推理服务端调用基于Caffe框架部署的模型在GPU上进行推理;接收所述推理服务端返回的计算结果;将所述计算结果发送给所述客户端。本公开的一些技术效果在于:通过在容器中加载推理服务端,调用Caffe框架部署的模型在GPU上进行推理,能以较高的效率满足客户端的服务请求。