一种可将任意语音转换成多个语音的转换方法及装置
基本信息
申请号 | CN202111035937.9 | 申请日 | - |
公开(公告)号 | CN113470622A | 公开(公告)日 | 2021-10-01 |
申请公布号 | CN113470622A | 申请公布日 | 2021-10-01 |
分类号 | G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/16(2006.01)I | 分类 | 乐器;声学; |
发明人 | 曹艳艳;陈佩云;高君效 | 申请(专利权)人 | 成都启英泰伦科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 610041四川省成都市高新区天府五街200号菁蓉汇4号楼A座12层 | ||
法律状态 | - |
摘要
摘要 | 一种可将任意语音转换成多个语音的转换方法及装置,所述转换方法包括以下步骤:准备多个目标发音人的语料作为训练语料;提取各个训练语料的ppg特征;得到综合特征;获取训练集里目标发音人的发音人编码特征,得到均值模拟特征γ和方差模拟特征β;训练可将综合特征转为梅尔特征的转换模型;均值模拟特征γ和方差模拟特征β作为转换模型风格输入,综合特征作为转换模型内容输入,解码出不同发音人的梅尔频谱,实现不同声音的合成。本发明能够更好的解耦出说话内容信息,降低语音识别模型提取的ppg特征不准确对语音转换的影响。 |
