一种语音转换方法、装置、电子设备和存储介质
基本信息
申请号 | CN202110693848.7 | 申请日 | - |
公开(公告)号 | CN113421571A | 公开(公告)日 | 2021-09-21 |
申请公布号 | CN113421571A | 申请公布日 | 2021-09-21 |
分类号 | G10L15/26(2006.01)I;G10L13/08(2013.01)I;G10L13/04(2013.01)I;G10L13/02(2013.01)I | 分类 | 乐器;声学; |
发明人 | 贺来朋;孙见青;梁家恩 | 申请(专利权)人 | 云知声智能科技股份有限公司 |
代理机构 | - | 代理人 | - |
地址 | 100096北京市海淀区西三旗建材城内1幢一层101号 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种语音转换方法、装置、电子设备和存储介质,该方法应用于将源发音人的语音转换为目标发音人的语音,包括:获取源发音人的语音,根据源发音人的语音确定源发音人的文本;将源发音人的文本输入至目标发音人的语音合成模型和时长强制对齐模型中合成目标发音人的语音;其中,谱特征预测模块中包括时长模型以及声学特征模块。本申请通过时长强制对齐模型对源发音人的语音做强制对齐,得到源发音人的强制对齐时长信息,使用强制对齐的时长信息对时长模型预测的时长做调整,得到调整后的时长信息,并根据调整后的时长信息合成目标发音人的语音,使得转换后语音的语速与输入语音保持一致,从而使得转换后语音的发音风格与源发音人保持一致。 |
