一种规避机器翻译译文片段重复的方法专利查询专利号|摘要-满商公司网

一种规避机器翻译译文片段重复的方法

基本信息

摘要

摘要	本发明公开一种规避机器翻译译文片段重复的方法，属于自然语言处理中的机器翻译领域，在机器翻译的贪婪算法解码过程中，利用译文重复片段检测机制，对重复的生成的目标词语的生成概率进行惩罚，随着重复片段的长度增加，依次对目标词生成概率进行对数级、线性级、指数级惩罚，从而达到规避机器翻译生成重复片段的目的，本发明阶梯惩罚、逐步加重，保证既不过多影响原有译文解码过程，也能有效降低重复片段惩罚的漏警率；本发明充分考虑了原文中存在重复片段的情况，允许译文的重复片段长度小于或等于原文重复片段的长度，因此最大程度上保证了原文和译文的一致性，即降低了本提案方法的虚警率。