语言处理方法及装置、语言处理系统的训练方法及装置
基本信息
申请号 | CN201910867015.0 | 申请日 | - |
公开(公告)号 | CN110598222A | 公开(公告)日 | 2019-12-20 |
申请公布号 | CN110598222A | 申请公布日 | 2019-12-20 |
分类号 | G06F17/28(2006.01); G06N3/08(2006.01) | 分类 | 计算;推算;计数; |
发明人 | 徐智涛; 唐剑波; 李长亮; 郭馨泽 | 申请(专利权)人 | 成都金山数字娱乐科技有限公司 |
代理机构 | 北京智信禾专利代理有限公司 | 代理人 | 北京金山数字娱乐科技有限公司; 成都金山数字娱乐科技有限公司 |
地址 | 100085 北京市海淀区小营西路33号金山软件大厦2层西区 | ||
法律状态 | - |
摘要
摘要 | 本申请提供了语言处理方法及装置、语言处理系统的训练方法及装置,其中,所述语言处理方法包括:将包括多个待翻译语句的目标段落输入翻译模型,得到每个待翻译语句对应的翻译语句;将包含连接词的翻译语句中的连接词替换为连接标记,将不包含连接词的翻译语句中插入连接标记,生成每个翻译语句对应的标记翻译语句;将多个标记翻译语句输入已训练好的语言模型,语言模型将连接标记删除或替换为对应的最终连接词,得到每个标记翻译语句对应的最终翻译语句,根据每个标记翻译语句对应的最终翻译语句拼接得到翻译段落,从而使段落的翻译结果的语义表达更加流畅,实现了目标任务语言处理的有效提升。 |
