一种自动拓增语料的语音合成模型训练方法和系统
基本信息
申请号 | CN201910726585.8 | 申请日 | - |
公开(公告)号 | CN110390928B | 公开(公告)日 | 2022-01-11 |
申请公布号 | CN110390928B | 申请公布日 | 2022-01-11 |
分类号 | G10L13/02(2013.01)I;G10L13/047(2013.01)I;G10L13/08(2013.01)I | 分类 | 乐器;声学; |
发明人 | 徐波 | 申请(专利权)人 | 广州多益网络股份有限公司 |
代理机构 | 广州三环专利商标代理有限公司 | 代理人 | 麦小婵;郝传鑫 |
地址 | 510530广东省广州市萝岗区伴河路90号自编一栋301房 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种自动拓增语料的语音合成模型训练方法和系统,收集文本‑语音平行语料,记为原始语料;将每个语音、文本样本按照语音停顿分割成若干语音、文本片段,汇集语音、文本片段记为片段语料;构建语音合成模型;从原始语料中随机选择m个样本,将文本、语音样本分别拼接构成新的语料样本,记为原始构造语料;从片段语料中随机选择n个样本,将文本、语音片段分别拼接构成新的语料样本为片段构造语料;使用原始构造语料和片段构造语料训练语音合成模型;使用原始语料、片段语料和原始构造语料继续训练,直至得到能够稳定合成语音的语音合成模型。本发明提高语音合成模型的泛化能力和稳健程度,使得能够合成各种状况下的文本。 |
