提升语音合成自然度的方法、装置以及存储介质

基本信息

申请号 CN202010988016.3 申请日 -
公开(公告)号 CN114283778A 公开(公告)日 2022-04-05
申请公布号 CN114283778A 申请公布日 2022-04-05
分类号 G10L13/02(2013.01)I;G10L13/08(2013.01)I;G10L25/18(2013.01)I;G10L25/30(2013.01)I 分类 乐器;声学;
发明人 黄磊;王洪斌;蒋宁;吴海英;权圣;杨春勇 申请(专利权)人 北京有限元科技有限公司
代理机构 北京万思博知识产权代理有限公司 代理人 刘冀
地址 100080北京市海淀区王庄路1号B座23层27-整层2702
法律状态 -

摘要

摘要 本申请公开了一种提升语音合成自然度的方法、装置以及存储介质。其中,该方法包括:获取用于音频合成的文本信息;确定与文本信息的发音特征对应的第一发音特征信息;以及根据第一发音特征信息以及预先训练的音频生成模型,生成音频的梅尔频谱特征,并根据梅尔频谱特征确定目标音频,其中音频生成模型由发音特征信息和声纹特征信息训练得到。