一种有效加速深度学习计算的内存分配方法及系统
基本信息
申请号 | CN202110028503.X | 申请日 | - |
公开(公告)号 | CN112346877B | 公开(公告)日 | 2021-04-16 |
申请公布号 | CN112346877B | 申请公布日 | 2021-04-16 |
分类号 | G06F9/50(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 李国亮;张磊;杨勤富;钱军 | 申请(专利权)人 | 瀚博半导体(上海)有限公司 |
代理机构 | 上海市金茂律师事务所 | 代理人 | 王翠平;彭世明 |
地址 | 201210上海市浦东新区自由贸易试验区集创路号、银冬路491号1幢4楼07、08室 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种有效加速深度学习的内存分配方法及系统,所述的方法及系统可以根据多分支运算层运算所需内存空间大小,确定所述多分支运算层的目标运算顺序;确定按照所述目标运算顺序执行所述多分支运算层的各分支运算结果连续存储的目标内存分配方案;根据所述目标内存分配方案及所述目标运算顺序,确定执行所述多分支运算层的内存分配方案。从而在执行多分支运算时,可以选择运算过程中占用内存空间最小的运算顺序作为目标运算顺序,根据所述多分支运算层各分支结果连续存储的目标内存方案,对所述多分支逐层进行内存分配设置,确保各分支运算结果连续存储在内存空间中,从而降低了占用内存空间大小,提高了整个神经网络的运算效率。 |
