一种减少移动设备存储空间消耗以及计算量的方法及系统

基本信息

申请号 CN201810460805.2 申请日 -
公开(公告)号 CN108764458B 公开(公告)日 2021-03-02
申请公布号 CN108764458B 申请公布日 2021-03-02
分类号 G06N3/04(2006.01)I;G06F16/28(2019.01)I 分类 计算;推算;计数;
发明人 李明;彭志谍 申请(专利权)人 武汉环宇智行科技有限公司
代理机构 武汉智嘉联合知识产权代理事务所(普通合伙) 代理人 黄君军
地址 430000湖北省武汉市洪山区文化大道555号融科智谷A2栋305号
法律状态 -

摘要

摘要 本发明公开了一种非均匀量化的模型压缩方法及系统,首先对卷积神经网络的权值进行聚类,将每个簇里的权值量化为该簇中心点的值,计算每一簇中所有权值量化后的量化误差总和,当一簇的量化误差总和大于预设阈值时,将该簇以等间隔划分区间的方式进行再次量化,以减小权值量化的误差;对权值的量化采用的是非均匀量化的方法,不光使权值的数量和存储空间减少,神经网络整体的量化误差将会更小,整体网络的精度基本不会有损失;用量化阶索引存储量化后的权值可减少权值的存储空间;将量化后的权值和卷积神经网络的输入数据定点化,使卷积神经网络模型的计算速度和计算效率得到了显著提高。