一种基于通用神经网络处理器并行加速ResNet的实现方法

基本信息

申请号 CN202110780533.6 申请日 -
公开(公告)号 CN113657575A 公开(公告)日 2021-11-16
申请公布号 CN113657575A 申请公布日 2021-11-16
分类号 G06N3/04(2006.01)I;G06N3/063(2006.01)I;G06N3/08(2006.01)I;G06F9/38(2006.01)I 分类 计算;推算;计数;
发明人 杨龚轶凡;闯小明;郑瀚寻;王润哲 申请(专利权)人 苏州仰思坪半导体有限公司
代理机构 北京棘龙知识产权代理有限公司 代理人 张开
地址 215000江苏省苏州市高新区马涧路2000号1幢11层1113-2室
法律状态 -

摘要

摘要 本发明公开了一种基于通用神经网络处理器并行加速ResNet的实现方法,包括以下步骤:将数据集和权重从中央缓存区载入寄存器,进行卷积层的运算,将权重矩阵从寄存器载入矩阵乘法单元;以流数据的方式将数据集矩阵送入矩阵乘法单元,并将运算结果写回寄存器,重复这一过程直到全部的数据处理完毕;用向量压缩单元完成批标准化的运算;用SIMD运算单元完成线性整流的运算;用SIMD运算单元和向量压缩单元完成池化层的运算;用矩阵乘法单元完成全连接层的运算,结果写回到寄存器;将寄存器中的结果写回中央缓存区。采用矩阵乘法单元完成卷积层和全连接层的运算,具备最佳的性能和性能功耗比,实现更低的能源消耗,更短的模型收敛时间,更快的图像识别速度。