基于多粒度的深度神经网络结构化稀疏系统和方法
基本信息
申请号 | CN201910556539.8 | 申请日 | - |
公开(公告)号 | CN110276450A | 公开(公告)日 | 2021-07-06 |
申请公布号 | CN110276450A | 申请公布日 | 2021-07-06 |
分类号 | G06N3/08;G06N3/04 | 分类 | 计算;推算;计数; |
发明人 | 谭展宏;马恺声 | 申请(专利权)人 | 交叉信息核心技术研究院(西安)有限公司 |
代理机构 | 西安通大专利代理有限责任公司 | 代理人 | 李红霖 |
地址 | 710077 陕西省西安市雁塔区天谷八路软件新城二期B3五层 | ||
法律状态 | - |
摘要
摘要 | 本发明提供基于多粒度的深度神经网络结构化稀疏系统和方法,将三个粒度层次的权重剪枝以及激活输入的稀疏结合起来进行算法优化和系统架构,能够高效地将深度神经网络部署到边缘设备,在低能耗约束条件下取得可观的性能。通过结合通道层次、滤波器层次和滤波器内剪枝三个层次,同时考虑硬件并行计算的约束,使得通道剪枝和滤波器剪枝的结果,其数目为16的倍数;对于滤波器内的剪枝,通过算法优化使得其形状满足特定要求,从而能够实现在硬件约束下的多粒度剪枝;通过三值网络进行低比特量化,并且与后续的剪枝相结合,不仅保证有可观的准确性和稳定性,还可以很好地实现无乘法器的设计,从而实现低功耗的目的。 |
