一种基于解码器输入增强的非自回归神经机器翻译方法

基本信息

申请号 CN202110592520.6 申请日 -
公开(公告)号 CN113468895A 公开(公告)日 2021-10-01
申请公布号 CN113468895A 申请公布日 2021-10-01
分类号 G06F40/58(2020.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 杜权;徐萍;杨迪 申请(专利权)人 沈阳雅译网络技术有限公司
代理机构 沈阳新科知识产权代理事务所(特殊普通合伙) 代理人 李晓光
地址 110004辽宁省沈阳市和平区三好街78号东软电脑城C座11层
法律状态 -

摘要

摘要 本发明公开一种基于解码器输入增强的非自回归神经机器翻译方法,步骤为:构造非自回归神经机器翻译模型;构建双语混合预训练模型;将双语混合句子作为编码器的输入,通过解码器来预测编码器中被替换的片段;用双语混合预训练模型编码器的词嵌入初始化非自回归神经机器翻译模型编码器和解码器的词嵌入;构建训练平行语料,生成机器翻译词表;通过解码器预测对应的目标语句子;计算预测出的分布与真实数据分布的差异,完成非自回归神经机器翻译模型的训练过程;将源语句子送入非自回归神经机器翻译模型中。本发明通过词典替换的方式将源语与目标语的表示映射到了同一的词义空间下,丰富了词向量的表达能力,可被非自回归神经机器翻译模型更好利用。