神经网络模型的编译方法和装置、电子设备和存储介质
基本信息
申请号 | CN202111595178.1 | 申请日 | - |
公开(公告)号 | CN114492730A | 公开(公告)日 | 2022-05-13 |
申请公布号 | CN114492730A | 申请公布日 | 2022-05-13 |
分类号 | G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 李军 | 申请(专利权)人 | 北京地平线信息技术有限公司 |
代理机构 | 北京思源智汇知识产权代理有限公司 | 代理人 | - |
地址 | 100094北京市海淀区丰豪东路9号院2号楼3层1单元301 | ||
法律状态 | - |
摘要
摘要 | 本公开实施例公开了一种神经网络模型的编译方法和装置、电子设备和存储介质,其中,方法包括:针对待编译神经网络模型对应的第一模型中的至少一个逐点卷积层中的第一逐点卷积层,基于预设张量折叠规则对第一逐点卷积层的原输入张量进行数据结构变换,获得变换后的第一输入张量,使得第一输入张量在至少一个维度上的尺寸与乘法器的对齐要求的尺寸的第一距离小于原输入张量对应的第二距离;基于第一输入张量获得第一逐点卷积层对应的优化后的第二逐点卷积层;基于第二逐点卷积层获得第一模型对应的优化模型;根据优化模型生成待编译神经网络模型对应的二进制的目标模型。本公开实施例可以有效减少对齐填充量,从而提高乘法器的有效利用率。 |