提升语音合成自然度的方法、装置以及存储介质
基本信息
申请号 | CN202010988016.3 | 申请日 | - |
公开(公告)号 | CN114283778A | 公开(公告)日 | 2022-04-05 |
申请公布号 | CN114283778A | 申请公布日 | 2022-04-05 |
分类号 | G10L13/02(2013.01)I;G10L13/08(2013.01)I;G10L25/18(2013.01)I;G10L25/30(2013.01)I | 分类 | 乐器;声学; |
发明人 | 黄磊;王洪斌;蒋宁;吴海英;权圣;杨春勇 | 申请(专利权)人 | 北京有限元科技有限公司 |
代理机构 | 北京万思博知识产权代理有限公司 | 代理人 | 刘冀 |
地址 | 100080北京市海淀区王庄路1号B座23层27-整层2702 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种提升语音合成自然度的方法、装置以及存储介质。其中,该方法包括:获取用于音频合成的文本信息;确定与文本信息的发音特征对应的第一发音特征信息;以及根据第一发音特征信息以及预先训练的音频生成模型,生成音频的梅尔频谱特征,并根据梅尔频谱特征确定目标音频,其中音频生成模型由发音特征信息和声纹特征信息训练得到。 |
