一种神经网络模型的量化方法及装置
基本信息
申请号 | CN202010290732.4 | 申请日 | - |
公开(公告)号 | CN111563589A | 公开(公告)日 | 2020-08-21 |
申请公布号 | CN111563589A | 申请公布日 | 2020-08-21 |
分类号 | G06N3/08(2006.01)I | 分类 | - |
发明人 | 梁宽涛 | 申请(专利权)人 | 中科物栖(北京)科技有限责任公司 |
代理机构 | 北京和信华成知识产权代理事务所(普通合伙) | 代理人 | 胡剑辉 |
地址 | 100086北京市海淀区科学院南路6号中国科学院计算技术研究所科研综合楼12层1248室 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例涉及一种神经网络模型的量化方法及装置,所述方法包括:在第一约束条件下确定神经网络模型每一层的第一量化位宽,第一约束条件依赖指定的电阻随机存取存储器ReRAM加速器的资源设置;针对神经网络模型的每一层,依据该层的第一量化位宽对该层的权重进行量化并将量化结果映射至ReRAM加速器,以及依据映射结果确定该层对应的第二约束条件;针对神经网络模型的每一层,对该层中的权重进行分块,针对每一分块,在该层对应的第二约束条件下确定该分块的第二量化位宽,并依据第二量化位宽对该分块中的权重进行量化。由此,可以实现最终确定出的量化方案既可以使得ReRAM加速器的资源利用率最高,又可以使得量化之后的神经网络模型的精度最高。 |
