一种神经网络模型压缩方法及装置
基本信息
申请号 | CN202010306190.5 | 申请日 | - |
公开(公告)号 | CN111582471A | 公开(公告)日 | 2020-08-25 |
申请公布号 | CN111582471A | 申请公布日 | 2020-08-25 |
分类号 | G06N3/08(2006.01)I;G06N3/04(2006.01)I | 分类 | - |
发明人 | 方济生 | 申请(专利权)人 | 中科物栖(北京)科技有限责任公司 |
代理机构 | 北京和信华成知识产权代理事务所(普通合伙) | 代理人 | 胡剑辉 |
地址 | 100086北京市海淀区科学院南路6号中国科学院计算技术研究所科研综合楼12层1248室 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例涉及一种神经网络模型压缩方法及装置,所述方法包括:对已训练的神经网络模型中的权重和激活值进行量化;确定量化后的神经网络模型中每一层的位剪枝强度;针对所述量化后的神经网络模型的每一层,基于该层的位剪枝强度对该层中的权重进行剪枝处理;对剪枝处理后的神经网络模型进行重训练。由此,可以实现充分地降低神经网络模型的位冗余,进一步则可以使得神经网络模型在位串行加速器上具有良好的性能表现。 |
