基于自适应算法的非对称语料库条件下的语音转换方法
基本信息
申请号 | CN201310146293.X | 申请日 | - |
公开(公告)号 | CN103280224B | 公开(公告)日 | 2015-09-16 |
申请公布号 | CN103280224B | 申请公布日 | 2015-09-16 |
分类号 | G10L21/00(2013.01)I;G10L15/07(2013.01)I | 分类 | 乐器;声学; |
发明人 | 宋鹏;包永强;赵力;刘健刚 | 申请(专利权)人 | 南京宇音力新电子科技有限公司 |
代理机构 | 南京苏高专利商标事务所(普通合伙) | 代理人 | 东南大学;上海泰宇信息技术股份有限公司 |
地址 | 210096 江苏省南京市玄武区四牌楼2号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于自适应算法的非对称语料库条件下的语音转换方法,首先运用MAP算法利用少量训练语句从参考说话人模型中分别训练得到源说话人和目标说话人的模型。然后,利用自适应说话人模型中的参数,分别提出了高斯归一化和均值转换的方法。并且为了进一步提高转换效果,进而提出了将高斯归一化方法和均值转换融合的方法。同时,由于训练语句有限,必然影响自适应模型的准确性,本发明提出了KL散度的方法在转换时对说话人模型进行优化,主客观实验结果表明:无论是频谱失真度,还是转换语音的质量以及与目标语音的相似度。本发明提出的方法都获得了和基于对称语料库条件下的经典GMM方法可比拟的效果。 |
