一种模型部署方法、装置、设备及存储介质

基本信息

申请号 CN202210448435.7 申请日 -
公开(公告)号 CN114721674A 公开(公告)日 2022-07-08
申请公布号 CN114721674A 申请公布日 2022-07-08
分类号 G06F8/61(2018.01)I;G06F8/71(2018.01)I;G06F9/50(2006.01)I 分类 计算;推算;计数;
发明人 龚乐诚;马兴宇;康平 申请(专利权)人 上海浦东发展银行股份有限公司
代理机构 北京品源专利代理有限公司 代理人 -
地址 200000上海市黄浦区中山东一路12号
法律状态 -

摘要

摘要 本发明公开了一种模型部署方法、装置、设备及存储介质。该方法包括:获取模型配置信息、元数据和模型文件,其中,所述模型配置信息包括:环境镜像信息;将所述模型文件和所述模型配置信息上传至测试Kubernetes集群的本地,并将所述模型配置信息写入后台数据库;根据所述模型配置信息生成第一yaml配置文件;接收测试指令,并将所述测试指令发送至所述测试Kubernetes集群,以使所述测试Kubernetes集群根据所述第一yaml配置文件部署模型,通过本发明的技术方案,解决了模型管理中的元数据信息缺失、缺乏模型评估结果、模型部署中的计算资源监控缺失以及缺乏弹性扩容的问题。能够简化模型部署的过程,支持动态弹性扩容,可以随时增加模型计算总资源。