边缘计算环境下用于分布式DNN训练的梯度压缩方法
基本信息
申请号 | CN202110766163.0 | 申请日 | - |
公开(公告)号 | CN113467949A | 公开(公告)日 | 2021-10-01 |
申请公布号 | CN113467949A | 申请公布日 | 2021-10-01 |
分类号 | G06F9/50(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 毛莺池;吴俊;聂华;黄建新;徐淑芳;屠子健;戚荣志;郭宏乐 | 申请(专利权)人 | 中科可控信息产业有限公司 |
代理机构 | 南京乐羽知行专利代理事务所(普通合伙) | 代理人 | 李玉平 |
地址 | 211100江苏省南京市江宁开发区佛城西路8号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开一种边缘计算环境下用于分布式DNN训练的梯度压缩方法,建立基于梯度数量的选择标准,筛选满足模型压缩标准的梯度网络层;根据梯度熵评估梯度重要性,自适应地选择梯度稀疏化的阈值,基于灵活的阈值对梯度稀疏化压缩;根据梯度残差和动量矫正机制,累积并优化梯度残差,减少梯度稀疏造成训练模型的性能损失;根据三元量化压缩方案,量化稀疏后的梯度,得到稀疏三元张量;根据无损编码技术,记录传递张量中非零梯度的距离,并对其优化编码,输出稀疏三元化梯度。本发明基于梯度数量和梯度熵的稀疏三元梯度压缩算法,能自适应地压缩分布式DNN训练中梯度交换阶段的梯度大小,有效地提高分布式DNN训练的通信效率。 |
