一种可将任意语音转换成多个语音的转换方法及装置

基本信息

申请号 CN202111035937.9 申请日 -
公开(公告)号 CN113470622A 公开(公告)日 2021-10-01
申请公布号 CN113470622A 申请公布日 2021-10-01
分类号 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/16(2006.01)I 分类 乐器;声学;
发明人 曹艳艳;陈佩云;高君效 申请(专利权)人 成都启英泰伦科技有限公司
代理机构 - 代理人 -
地址 610041四川省成都市高新区天府五街200号菁蓉汇4号楼A座12层
法律状态 -

摘要

摘要 一种可将任意语音转换成多个语音的转换方法及装置,所述转换方法包括以下步骤:准备多个目标发音人的语料作为训练语料;提取各个训练语料的ppg特征;得到综合特征;获取训练集里目标发音人的发音人编码特征,得到均值模拟特征γ和方差模拟特征β;训练可将综合特征转为梅尔特征的转换模型;均值模拟特征γ和方差模拟特征β作为转换模型风格输入,综合特征作为转换模型内容输入,解码出不同发音人的梅尔频谱,实现不同声音的合成。本发明能够更好的解耦出说话内容信息,降低语音识别模型提取的ppg特征不准确对语音转换的影响。