一种适用于电商直播中虚拟主播的自动语音合成方法

基本信息

申请号 CN202210285104.6 申请日 -
公开(公告)号 CN114387947A 公开(公告)日 2022-04-22
申请公布号 CN114387947A 申请公布日 2022-04-22
分类号 G10L13/08(2013.01)I;H04N21/2187(2011.01)I;H04N21/233(2011.01)I 分类 乐器;声学;
发明人 梁晨阳 申请(专利权)人 北京中科深智科技有限公司
代理机构 - 代理人 -
地址 100000北京市大兴区北京经济技术开发区永昌中路4号院4号楼3层311A室
法律状态 -

摘要

摘要 本发明公开了一种适用于电商直播中虚拟主播的自动语音合成方法,包括:对中文数据进行处理,以获取中文音频,以及中文因素库;对英文单词进行处理,以获取英文单词音频,并根据中文因素库,获取英文单词对应的中文因素标签;对英文字母进行处理,以获取英文字母发音音频,以及字母对应的中文因素标签;将中文音频、中文因素库、英文单词音频、英文单词对应的中文因素标签、字母发音音频和字母对应的中文因素标签作为混合预料进行模型训练,以获取语音模型;对待合成的语料进行预处理,以获取对应的中文音素标签,并输入至语音模型,生成文本对应的音频文件,完成语音合成。本发明具有较好的中英混合能力,并且语音自然。