语音合成方法、系统、语音合成模型及其训练方法

基本信息

申请号 CN202111205560.7 申请日 -
公开(公告)号 CN113948061A 公开(公告)日 2022-01-18
申请公布号 CN113948061A 申请公布日 2022-01-18
分类号 G10L13/08(2013.01)I;G10L13/10(2013.01)I;G10L25/63(2013.01)I 分类 乐器;声学;
发明人 司马华鹏;毛志强 申请(专利权)人 宿迁硅基智能科技有限公司
代理机构 北京弘权知识产权代理有限公司 代理人 逯长明;许伟群
地址 223808江苏省宿迁市湖滨新区保险小镇B19栋201室
法律状态 -

摘要

摘要 本申请提供一种语音合成方法、系统、语音合成模型及其训练方法,所述方法包括获取目标文本和目标文本的第一瓶颈特征;获取参考音频库,参考音频库包括若干参考音频;获取参考音频库中每一个参考音频对应的参考文本,以及,获取每一个参考文本的第二瓶颈特征;计算第一瓶颈特征与每一个参考文本的第二瓶颈特征的相似度,将与第一瓶颈特征相似度最高的第二瓶颈特征对应的参考文本确定为文本模板;将文本模板对应的参考音频确定为音频模板;将音频模板和目标文本输入预先训练的语音合成模型中,以合成具备深度情感层次特征的语音。