数据处理方法、装置、芯片以及计算机可读存储介质

基本信息

申请号 CN202010142403.5 申请日 -
公开(公告)号 CN111428879A 公开(公告)日 2020-07-17
申请公布号 CN111428879A 申请公布日 2020-07-17
分类号 G06N20/00;G06N3/04;G06N3/063;G06N3/08 分类 计算;推算;计数;
发明人 闯小明;杨龚轶凡;郑瀚寻;高雷;侯觉 申请(专利权)人 深圳芯英科技有限公司
代理机构 - 代理人 -
地址 518057 广东省深圳市南山区粤海街道科技生态园10栋B座5-15
法律状态 -

摘要

摘要 本发明实施例公开了一种数据处理方法、装置、芯片以及计算机可读存储介质,用于加速深度学习模型训练中批标准化层的运算。通过将多维张量数据按照预设规则存入第一存储器,再以二维数据的形式取出来并进行运算,并通过几个寄存器组以及第二存储器配合使用构建出第三矩阵,通过将第一矩阵和第三矩阵进行矩阵相乘可同时求出第一矩阵中的每一行的元素和与元素平方和,实现了求元素和与求元平方和的并行计算,从而加速批标准化层中的涉及均值和方差的计算,解决了批标准化层运算过程中因数据量过大而导致运算耗时长的问题。最终使批标准化操作的运算速度得以提高,极大地缩短了深度学习模型训练整体所需的时间。