一种基于通用神经网络处理器并行加速ResNet的实现方法
基本信息
申请号 | CN202110780533.6 | 申请日 | - |
公开(公告)号 | CN113657575A | 公开(公告)日 | 2021-11-16 |
申请公布号 | CN113657575A | 申请公布日 | 2021-11-16 |
分类号 | G06N3/04(2006.01)I;G06N3/063(2006.01)I;G06N3/08(2006.01)I;G06F9/38(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 杨龚轶凡;闯小明;郑瀚寻;王润哲 | 申请(专利权)人 | 苏州仰思坪半导体有限公司 |
代理机构 | 北京棘龙知识产权代理有限公司 | 代理人 | 张开 |
地址 | 215000江苏省苏州市高新区马涧路2000号1幢11层1113-2室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于通用神经网络处理器并行加速ResNet的实现方法,包括以下步骤:将数据集和权重从中央缓存区载入寄存器,进行卷积层的运算,将权重矩阵从寄存器载入矩阵乘法单元;以流数据的方式将数据集矩阵送入矩阵乘法单元,并将运算结果写回寄存器,重复这一过程直到全部的数据处理完毕;用向量压缩单元完成批标准化的运算;用SIMD运算单元完成线性整流的运算;用SIMD运算单元和向量压缩单元完成池化层的运算;用矩阵乘法单元完成全连接层的运算,结果写回到寄存器;将寄存器中的结果写回中央缓存区。采用矩阵乘法单元完成卷积层和全连接层的运算,具备最佳的性能和性能功耗比,实现更低的能源消耗,更短的模型收敛时间,更快的图像识别速度。 |
