一种规约运算的拓扑选择方法、装置、设备及介质

基本信息

申请号 CN202210347726.7 申请日 -
公开(公告)号 CN114707651A 公开(公告)日 2022-07-05
申请公布号 CN114707651A 申请公布日 2022-07-05
分类号 G06N3/063(2006.01)I;G06N20/00(2019.01)I 分类 计算;推算;计数;
发明人 刘邦岚;丁圣阁 申请(专利权)人 上海燧原科技有限公司
代理机构 北京品源专利代理有限公司 代理人 -
地址 201306上海市浦东新区中国(上海)自由贸易试验区临港新片区业盛路188号A-522室
法律状态 -

摘要

摘要 本发明公开了一种规约运算的拓扑选择方法、装置、设备及介质,包括:获取分布式训练任务中各加速卡对应的链路信息,根据链路信息确定各加速卡与其他加速卡之间的链路类型,对每种链路类型对应的传输性能以及计算性能进行探测,得到传输性能探测结果以及计算性能探测结果,对每种链路类型对应的控制开销进行探测,得到控制开销探测结果,根据传输性能探测结果、计算性能探测结果、控制开销探测结果以及规约数据量,选择与各加速卡中规约运算环节匹配的目标拓扑结构。本发明实施例的技术方案可以为分布式训练任务中的规约运算环节选择最优的拓扑结构,减少分布式训练过程的耗时以及硬件的维护成本。