模型训练方法及装置、存储介质及电子设备专利查询专利号|摘要-满商公司网

模型训练方法及装置、存储介质及电子设备

基本信息

摘要

摘要	本发明提供一种模型训练方法，包括：将多种图片类别以及所述神经网络基础模型分摊至不同的GPU显卡，选取训练样本输入至每个GPU中的子模型中进行训练，确定训练样本在整体模型中属于每个图片类别的得分值的总得分值，并将该总得分值分别反向传输至每个GPU中；依据该总得分值，及训练样本图片在每个GPU中属于各个图片类别的得分值，对整个神经网络模型的损失函数的进行优化直到收敛，当损失函数的输出值满足预设的收敛条件时，也就完成对每个GPU中的训练子模型的训练。本发明提供的训练方法，可使神经网络能够对任意大规模类别的数据集进行训练，且模型数据传递量少，使得训练速度与小规模数据集类别训练相比几乎没有损失。