一种自动拓增语料的语音合成模型训练方法和系统专利查询专利号|摘要-满商公司网

一种自动拓增语料的语音合成模型训练方法和系统

基本信息

摘要

摘要	本发明公开了一种自动拓增语料的语音合成模型训练方法和系统，收集文本‑语音平行语料，记为原始语料；将每个语音、文本样本按照语音停顿分割成若干语音、文本片段，汇集语音、文本片段记为片段语料；构建语音合成模型；从原始语料中随机选择m个样本，将文本、语音样本分别拼接构成新的语料样本，记为原始构造语料；从片段语料中随机选择n个样本，将文本、语音片段分别拼接构成新的语料样本为片段构造语料；使用原始构造语料和片段构造语料训练语音合成模型；使用原始语料、片段语料和原始构造语料继续训练，直至得到能够稳定合成语音的语音合成模型。本发明提高语音合成模型的泛化能力和稳健程度，使得能够合成各种状况下的文本。