多语言机器翻译方法、装置、电子设备和存储介质

基本信息

申请号 CN202110697871.3 申请日 -
公开(公告)号 CN113239710A 公开(公告)日 2021-08-10
申请公布号 CN113239710A 申请公布日 2021-08-10
分类号 G06F40/58(2020.01)I;G06F40/30(2020.01)I 分类 计算;推算;计数;
发明人 叶忠义 申请(专利权)人 合肥讯飞数码科技有限公司
代理机构 北京路浩知识产权代理有限公司 代理人 张雅娜
地址 230088安徽省合肥市高新区望江西路666号讯飞大厦1805、1807室
法律状态 -

摘要

摘要 本发明提供一种多语言机器翻译方法、装置、电子设备和存储介质,所述方法包括:确定待翻译的源语言文本;将所述源语言文本输入至多语言翻译模型,得到所述多语言翻译模型输出的目标语言文本;其中,所述多语言翻译模型是基于预训练编码器构建的,所述预训练编码器是以对多语言平行句对进行编码得到统一编码结果为目标训练得到的。本发明提供的方法、装置、电子设备和存储介质,通过预训练编码器能够学习到不同语言句子的统一语义表示,再基于预训练编码器得到多语言翻译模型,从而可以使得机器翻译模型能够更加容易地学习语义对齐关系,进而能够改善多语言机器翻译效果,提高多语言机器翻译模型的泛化性能。