一种基于前端设计的语音模型训练方法及语音合成方法

基本信息

申请号 CN202110762178.X 申请日 -
公开(公告)号 CN113257221B 公开(公告)日 2021-09-17
申请公布号 CN113257221B 申请公布日 2021-09-17
分类号 G10L13/027;G10L13/08;G10L13/10;G10L25/30;G06N3/08 分类 乐器;声学;
发明人 陈佩云;曹艳艳;高君效 申请(专利权)人 成都启英泰伦科技有限公司
代理机构 - 代理人 -
地址 610041 四川省成都市高新区天府五街200号菁蓉汇4号楼A座12层
法律状态 -

摘要

摘要 一种基于前端设计的语音模型训练方法及语音合成方法,包括样本采集及后续步骤:后续步骤为:S1:生成带有韵律标注的韵律标注文本;S2:得到文本内容的语言学特征第一编码;S3:获取每个音素的发音时长;S4:训练每个音素的发音时长模型;S5:输出固定维度的前端特征编码向量;S6:进行迭代训练得到自回归模型。本发明能有效减少单字单词在整句中发音错误和语速错误概率。同时可以通过对前端语言学特征及时长特征做微调来控制特殊音素的发音、音素发音时长、句子韵律等。