一种模型部署方法、装置、设备及存储介质
基本信息
申请号 | CN202210448435.7 | 申请日 | - |
公开(公告)号 | CN114721674A | 公开(公告)日 | 2022-07-08 |
申请公布号 | CN114721674A | 申请公布日 | 2022-07-08 |
分类号 | G06F8/61(2018.01)I;G06F8/71(2018.01)I;G06F9/50(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 龚乐诚;马兴宇;康平 | 申请(专利权)人 | 上海浦东发展银行股份有限公司 |
代理机构 | 北京品源专利代理有限公司 | 代理人 | - |
地址 | 200000上海市黄浦区中山东一路12号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种模型部署方法、装置、设备及存储介质。该方法包括:获取模型配置信息、元数据和模型文件,其中,所述模型配置信息包括:环境镜像信息;将所述模型文件和所述模型配置信息上传至测试Kubernetes集群的本地,并将所述模型配置信息写入后台数据库;根据所述模型配置信息生成第一yaml配置文件;接收测试指令,并将所述测试指令发送至所述测试Kubernetes集群,以使所述测试Kubernetes集群根据所述第一yaml配置文件部署模型,通过本发明的技术方案,解决了模型管理中的元数据信息缺失、缺乏模型评估结果、模型部署中的计算资源监控缺失以及缺乏弹性扩容的问题。能够简化模型部署的过程,支持动态弹性扩容,可以随时增加模型计算总资源。 |
