一种在FPGA上运行卷积神经网络的方法、装置及系统
基本信息
申请号 | CN201910075397.3 | 申请日 | - |
公开(公告)号 | CN109840589A | 公开(公告)日 | 2019-06-04 |
申请公布号 | CN109840589A | 申请公布日 | 2019-06-04 |
分类号 | G06N3/04(2006.01)I; G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 陈海波 | 申请(专利权)人 | 深兰人工智能芯片研究院(江苏)有限公司 |
代理机构 | 北京同达信恒知识产权代理有限公司 | 代理人 | 深兰人工智能芯片研究院(江苏)有限公司 |
地址 | 213161 江苏省常州市武进区常武中路18号常州科教城创研港4号楼103 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种在FPGA上运行卷积神经网络的方法、装置及系统,用于解决现有技术中在FPGA上运行卷积神经网络时,存在实施步骤繁琐、时间成本高的问题。方法包括:上位机根据预设的量化位宽计算对卷积神经网络模型的每个卷积层的各个计算参数进行量化的压缩尺度;根据每个卷积层对应的压缩尺度,确定出FPGA在执行该卷积层的运算时,该FPGA对该卷积层进行卷积计算所使用的卷积核权重Wf、对该卷积层的卷积计算结果进行移位操作的移位尺度参数scalef1以及对该卷积层的移位计算结果进行偏置操作的偏置Biasf;将每个卷积层对应的Wf、scalef以及Biasf写入该FPGA,以使该FPGA在运行该卷积神经网络模型时,基于每个卷积层对应的Wf、scalef以及Biasf执行该卷积层的运算。 |
