一种模型训练的方法和装置
基本信息
申请号 | CN201911284996.2 | 申请日 | - |
公开(公告)号 | CN111047016A | 公开(公告)日 | 2020-04-21 |
申请公布号 | CN111047016A | 申请公布日 | 2020-04-21 |
分类号 | G06N3/04;G06N3/08 | 分类 | 计算;推算;计数; |
发明人 | 王洪伟;李长亮 | 申请(专利权)人 | 北京金山软件有限公司 |
代理机构 | 北京智信禾专利代理有限公司 | 代理人 | 成都金山互动娱乐科技有限公司;北京金山数字娱乐科技有限公司;北京金山软件有限公司 |
地址 | 100085 北京市海淀区小营西路33号金山软件大厦2层西区 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种模型训练的方法和装置,所述方法包括:监控模型的训练进度和训练进度对应的模型的损失值,在所述模型的训练进度到达预设的检查点的情况下,保存所述模型在检查点对应的模型参数,根据所述模型的损失值,在确定所述模型训练异常的情况下,直接设定所述模型的模型参数为所述模型在检查点对应的模型参数。直接调整所述模型的训练参数,使得模型的训练过程具有更大的随机性,从而继续进行模型的训练,确保模型的训练过程不停顿,能够加快模型的训练速度。 |
