一种语音处理模型的训练方法及装置
基本信息
申请号 | CN201910843789.X | 申请日 | - |
公开(公告)号 | CN110503945A | 公开(公告)日 | 2019-11-26 |
申请公布号 | CN110503945A | 申请公布日 | 2019-11-26 |
分类号 | G10L15/06(2013.01); G10L15/10(2006.01); G10L19/20(2013.01); G10L25/30(2013.01); G06F17/28(2006.01); G10L15/26(2006.01) | 分类 | 乐器;声学; |
发明人 | 王峰; 唐剑波; 李长亮; 郭馨泽 | 申请(专利权)人 | 成都金山数字娱乐科技有限公司 |
代理机构 | 北京智信禾专利代理有限公司 | 代理人 | 北京金山数字娱乐科技有限公司; 成都金山数字娱乐科技有限公司 |
地址 | 100085 北京市海淀区小营西路33号金山软件大厦2层西区 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种语音处理模型的训练方法及装置。其中,所述方法包括:获取训练样本和样本标签,所述训练样本包括源语言语音数据,所述样本标签包括标准目标语言语句和标准源语言音标序列;将所述源语言语音数据输入至所述编码器中进行处理,生成编码向量;将所述编码向量输入至所述第一解码器中进行处理,生成目标语言语句,并基于所述目标语言语句和所述标准目标语言语句对所述语音翻译模型进行更新;将所述编码向量输入至所述第二解码器中进行处理,生成源语言音标序列,并基于所述源语言音标序列与所述标准源语言音标序列对所述声学模型进行更新。本申请提供的语音处理模型的训练方法及装置,可以有效提升模型的训练效果。 |
