一种基于声学后验概率的任意说话人语音转换系统及方法

基本信息

申请号 CN202011057900.1 申请日 -
公开(公告)号 CN112634918A 公开(公告)日 2021-04-09
申请公布号 CN112634918A 申请公布日 2021-04-09
分类号 G10L21/013;G10L15/06;G10L13/02;G10L19/16 分类 乐器;声学;
发明人 宋丹丹;欧阳鹏;尹首一 申请(专利权)人 江苏清微智能科技有限公司
代理机构 北京索睿邦知识产权代理有限公司 代理人 李根
地址 211100 江苏省南京市江宁区麒麟科技创新园创研路266号人工智能产业园8号楼3层
法律状态 -

摘要

摘要 本发明公开一种基于声学后验概率的任意说话人语音转换系统及方法,属于基于深度学习的语音转换的技术技术领域。包括:一个语音识别模型、一个多说话人数据集、一个语音转换模型、一个目标说话人数据集和一个LPCNet声码器;预训练一个语音转换模型,自适应训练所述语音转换模型,通过LPCNet声码器完成所述声学特征到目标说话人对应转换语音的合成。本发明解决了现有技术中语音转换只能完成特定说话人之间且质量较低的问题。