一种翻译模型的训练方法及装置、翻译方法及装置

基本信息

申请号 CN202010215046.0 申请日 -
公开(公告)号 CN113449529A 公开(公告)日 2021-09-28
申请公布号 CN113449529A 申请公布日 2021-09-28
分类号 G06F40/58(2020.01)I;G06F40/289(2020.01)I;G06F40/284(2020.01)I;G06F40/205(2020.01)I 分类 计算;推算;计数;
发明人 李长亮;郭馨泽 申请(专利权)人 北京金山软件有限公司
代理机构 北京智信禾专利代理有限公司 代理人 王治东
地址 100085北京市海淀区小营西路33号金山软件大厦2层西区
法律状态 -

摘要

摘要 本申请提供一种翻译模型的训练方法及装置、翻译方法及装置,翻译模型包括:编码器和语言模型,语言模型采用目标语言的单语语料预训练得到;训练方法包括:将源语言样本语句输入至编码器,得到与源语言样本语句对应的第一编码向量;将与源语言样本语句对应的第一编码向量和目标语言样本语句输入至语言模型,得到语言模型输出的第一解码向量以及第一解码向量对应的误差;基于第一解码向量对应的误差调整语言模型和编码器的参数,直至达到训练停止条件,从而有效解决在双语语料资源稀缺的情况下导致翻译模型训练不充分,进而获得的翻译结果质量低下的问题,使翻译模型在低资源翻译任务下有更好的表现,进一步的,提高了翻译结果的质量。