一种减少移动设备存储空间消耗以及计算量的方法及系统
基本信息
申请号 | CN201810460805.2 | 申请日 | - |
公开(公告)号 | CN108764458B | 公开(公告)日 | 2021-03-02 |
申请公布号 | CN108764458B | 申请公布日 | 2021-03-02 |
分类号 | G06N3/04(2006.01)I;G06F16/28(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 李明;彭志谍 | 申请(专利权)人 | 武汉环宇智行科技有限公司 |
代理机构 | 武汉智嘉联合知识产权代理事务所(普通合伙) | 代理人 | 黄君军 |
地址 | 430000湖北省武汉市洪山区文化大道555号融科智谷A2栋305号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种非均匀量化的模型压缩方法及系统,首先对卷积神经网络的权值进行聚类,将每个簇里的权值量化为该簇中心点的值,计算每一簇中所有权值量化后的量化误差总和,当一簇的量化误差总和大于预设阈值时,将该簇以等间隔划分区间的方式进行再次量化,以减小权值量化的误差;对权值的量化采用的是非均匀量化的方法,不光使权值的数量和存储空间减少,神经网络整体的量化误差将会更小,整体网络的精度基本不会有损失;用量化阶索引存储量化后的权值可减少权值的存储空间;将量化后的权值和卷积神经网络的输入数据定点化,使卷积神经网络模型的计算速度和计算效率得到了显著提高。 |
