浮点神经网络模型量化系统和方法

基本信息

申请号 CN202011609407.6 申请日 -
公开(公告)号 CN112766484A 公开(公告)日 2021-05-07
申请公布号 CN112766484A 申请公布日 2021-05-07
分类号 G06N3/08(2006.01)I;G06N3/04(2006.01)I 分类 -
发明人 陈家麒;黄宇扬;冯建豪 申请(专利权)人 上海熠知电子科技有限公司
代理机构 上海智晟知识产权代理事务所(特殊普通合伙) 代理人 张东梅
地址 200060上海市普陀区中山北路3000号4508室
法律状态 -

摘要

摘要 本发明公开了一种浮点神经网络模型的量化系统,包括:组合校准算法单元,所述组合校准算法单元包括多种校准算法单元,组合校准算法单元为各个浮点神经网络模型或者一个浮点神经网络模型中的各个激活值分配不同的校准算法,以便获得量化参数,并对浮点神经网络进行量化,得到定点神经网络模型;自检优化单元,所述自检优化单元在校准数据集的一个子集上,推演浮点神经网络模型和定点神经网络模型,计算浮点神经网络模型和定点神经网络模型的结果的余弦相似度作为基准余弦相似度;自检优化单元微调初始量化参数,生成经微调的定点神经网络模型,计算浮点神经网络模型和经微调的定点神经网络模型的结果的余弦相似度;判断经微调的余弦相似度是否大于基准余弦相似度,如果经微调的余弦相似度大于基准余弦相似度,则利用经微调的量化参数、经微调的定点神经网络、经微调的余弦相似度更新量化参数、定点神经网络和基准余弦相似度。