一种模型训练的方法和装置

基本信息

申请号 CN201911284996.2 申请日 -
公开(公告)号 CN111047016A 公开(公告)日 2020-04-21
申请公布号 CN111047016A 申请公布日 2020-04-21
分类号 G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 王洪伟;李长亮 申请(专利权)人 北京金山软件有限公司
代理机构 北京智信禾专利代理有限公司 代理人 成都金山互动娱乐科技有限公司;北京金山数字娱乐科技有限公司;北京金山软件有限公司
地址 100085 北京市海淀区小营西路33号金山软件大厦2层西区
法律状态 -

摘要

摘要 本申请提供一种模型训练的方法和装置,所述方法包括:监控模型的训练进度和训练进度对应的模型的损失值,在所述模型的训练进度到达预设的检查点的情况下,保存所述模型在检查点对应的模型参数,根据所述模型的损失值,在确定所述模型训练异常的情况下,直接设定所述模型的模型参数为所述模型在检查点对应的模型参数。直接调整所述模型的训练参数,使得模型的训练过程具有更大的随机性,从而继续进行模型的训练,确保模型的训练过程不停顿,能够加快模型的训练速度。