基于MPI的神经网络架构搜索并行化方法和设备
基本信息
申请号 | CN202010144350.0 | 申请日 | - |
公开(公告)号 | CN111324630A | 公开(公告)日 | 2020-06-23 |
申请公布号 | CN111324630A | 申请公布日 | 2020-06-23 |
分类号 | G06F16/245(2019.01)I | 分类 | - |
发明人 | 曹连雨 | 申请(专利权)人 | 中科弘云科技(北京)有限公司 |
代理机构 | 北京八月瓜知识产权代理有限公司 | 代理人 | 中科弘云科技(北京)有限公司 |
地址 | 100080北京市海淀区上地信息产业基地开拓路7号1幢二层2209室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种基于MPI的神经网络架构搜索并行化方法和设备。该方法包括:根据当前多机环境中的GPU数量启动MPI进程,并按顺序进行编排;启动后的MPI进程根据其自己的序号从训练集中指定位置读取数据,并进行梯度计算;每个节点的GPU根据分层结构进行梯度规约计算,将计算的结果汇总至GPU中的首个GPU中;首个GPU按环形结构进行梯度全规约计算;在每个节点内从该首个GPU开始,按分层结构广播梯度计算结果;利用该新的梯度值更新神经网络的权值和偏置值。本发明能够在保证神经网络架构搜索结果模型的识别率的基础上,有效地加速神经网络架构搜索训练效率,大幅度减少训练时间,从而提升自动化深度学习过程的效率。 |
