模型部署方法、模型部署装置、终端设备及可读存储介质
基本信息
申请号 | CN202110567899.5 | 申请日 | - |
公开(公告)号 | CN113220457A | 公开(公告)日 | 2021-08-06 |
申请公布号 | CN113220457A | 申请公布日 | 2021-08-06 |
分类号 | G06F9/50;G06N3/10;G06N3/08;G06N3/04 | 分类 | 计算;推算;计数; |
发明人 | 李发兵;林伟伟;李想;毛兴中 | 申请(专利权)人 | 交叉信息核心技术研究院(西安)有限公司 |
代理机构 | 北京中巡通大知识产权代理有限公司 | 代理人 | 孟大帅 |
地址 | 710077 陕西省西安市高新区天谷八路软件新城云汇谷156号B2座11层 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种模型部署方法、模型部署装置、终端设备及可读存储介质,所述方法包括以下步骤:获取待部署深度神经网络模型的算子模型集合;将算子模型集合中满足预设条件的算子模型进行算子融合或算子分割处理,获得处理后的算子模型集合;获取所述处理后的算子模型集合中每个算子模型在用于部署模型的设备集合中的每个设备上的运行时间,获得运行时间集合;基于所述运行时间集合,采用预设搜索方法对所述处理后的算子模型集合中的算子模型进行组合,获得子模型集合;基于所述子模型集合,将待部署深度神经网络模型部署于所述设备集合上。本发明能够充分兼容不同算力的设备,可提高运行效率以及全局上的吞吐率。 |
