一种自动拓增语料的语音合成模型训练方法和系统

基本信息

申请号 CN201910726585.8 申请日 -
公开(公告)号 CN110390928B 公开(公告)日 2022-01-11
申请公布号 CN110390928B 申请公布日 2022-01-11
分类号 G10L13/02(2013.01)I;G10L13/047(2013.01)I;G10L13/08(2013.01)I 分类 乐器;声学;
发明人 徐波 申请(专利权)人 广州多益网络股份有限公司
代理机构 广州三环专利商标代理有限公司 代理人 麦小婵;郝传鑫
地址 510530广东省广州市萝岗区伴河路90号自编一栋301房
法律状态 -

摘要

摘要 本发明公开了一种自动拓增语料的语音合成模型训练方法和系统,收集文本‑语音平行语料,记为原始语料;将每个语音、文本样本按照语音停顿分割成若干语音、文本片段,汇集语音、文本片段记为片段语料;构建语音合成模型;从原始语料中随机选择m个样本,将文本、语音样本分别拼接构成新的语料样本,记为原始构造语料;从片段语料中随机选择n个样本,将文本、语音片段分别拼接构成新的语料样本为片段构造语料;使用原始构造语料和片段构造语料训练语音合成模型;使用原始语料、片段语料和原始构造语料继续训练,直至得到能够稳定合成语音的语音合成模型。本发明提高语音合成模型的泛化能力和稳健程度,使得能够合成各种状况下的文本。