一种基于TVM的NPU神经网络模型部署方法及装置
基本信息
申请号 | CN202210482702.2 | 申请日 | - |
公开(公告)号 | CN114721670A | 公开(公告)日 | 2022-07-08 |
申请公布号 | CN114721670A | 申请公布日 | 2022-07-08 |
分类号 | G06F8/60(2018.01)I;G06F8/41(2018.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N3/063(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 贾丰荣;蔡万伟;陈宁 | 申请(专利权)人 | 深圳云天励飞技术股份有限公司 |
代理机构 | 北京三聚阳光知识产权代理有限公司 | 代理人 | - |
地址 | 518000广东省深圳市龙岗区园山街道龙岗大道8288号深圳大运软件小镇17栋1楼 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种基于TVM的NPU神经网络模型部署方法及装置,包括:获取待部署的神经网络模型和当前NPU的硬件属性信息;根据神经网络模型的计算逻辑,确定待部署到当前NPU的卷积算子;根据当前NPU的硬件属性信息和各卷积算子的参数信息,确定各卷积算子在当前NPU中的最优参数配置;根据最优参数配置和当前NPU的硬件属性信息,调整tir层的数据布局和卷积权重,对relay层的参数进行修改,得到适配当前NPU的目标TVM;基于目标TVM,生成神经网络模型适用于当前NPU的部署文件。通过对TVM的tir层和relay层进行相应的参数调整,以使得到的目标TVM能够适配该NPU。 |
