一种可在线训练个性化音色库的语音合成方法和系统
基本信息
申请号 | CN202110271444.9 | 申请日 | - |
公开(公告)号 | CN113035169A | 公开(公告)日 | 2021-06-25 |
申请公布号 | CN113035169A | 申请公布日 | 2021-06-25 |
分类号 | G10L13/02;G10L13/04;G10L13/08 | 分类 | 乐器;声学; |
发明人 | 牛歌 | 申请(专利权)人 | 北京帝派智能科技有限公司 |
代理机构 | 北京弘权知识产权代理有限公司 | 代理人 | 郭放;许伟群 |
地址 | 100080 北京市海淀区海淀大街34号8层820室 | ||
法律状态 | - |
摘要
摘要 | 本申请实施例提供了一种可在线训练个性化音色库的语音合成方法及系统。其中,该方法包括:使用至少两组语料训练预训练语音合成模型,每一组语料包括文本及其录制语音,每一组语料的录制语音具有一种音色,不同组语料中的录制语音的音色不同;使用目标发音人的语料基于预训练语音合成模型训练语音合成模型,目标发音人的语料包括目标发音人的至少一句文本及其录制语音;将语音合成模型部署在语音合成系统中,以使得语音合成系统用于根据输入的文本合成目标音色的语音,目标音色为目标发音人的音色。本申请的技术方案使用少量的目标发音人的语料,快速且准确地训练得到一个语音合成模型,通过该模型可以准确地合成出与目标发音人音色一致的语音。 |
