翻译模型训练方法和翻译方法及其装置
基本信息
申请号 | CN202111250312.4 | 申请日 | - |
公开(公告)号 | CN114201975A | 公开(公告)日 | 2022-03-18 |
申请公布号 | CN114201975A | 申请公布日 | 2022-03-18 |
分类号 | G06F40/44(2020.01)I;G06F40/58(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 刘恒双;张为泰;许瑞阳 | 申请(专利权)人 | 科大讯飞股份有限公司 |
代理机构 | 北京路浩知识产权代理有限公司 | 代理人 | 郑朝然 |
地址 | 230088安徽省合肥市高新开发区望江西路666号 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例提供一种翻译模型训练方法和翻译方法及其装置。其中,模型训练方法包括:分别将平行双语句对中的源语言语句和加噪的源语言语句输入翻译模型,得到第一预测目标语言语句和第二预测目标语言语句,并分别获取翻译模型的第一预测概率分布、第二预测概率分布和/或各隐藏层输出的第一特征向量、第二特征向量;基于第一预测目标语言语句与平行双语句对中的目标语言语句、第二预测目标语言语句与加噪的源语言语句对应的目标语言语句、第一特征向量与第二特征向量和/或第一预测概率分布与第二预测概率分布,确定翻译模型的当前训练损失,调整翻译模型的参数。本发明实施例可以提升翻译模型的鲁棒性,并且训练方法简单,模型训练稳定。 |
