一种歌声合成方法、装置及可读存储介质

基本信息

申请号 CN202011542845.5 申请日 -
公开(公告)号 CN112750421A 公开(公告)日 2021-05-04
申请公布号 CN112750421A 申请公布日 2021-05-04
分类号 G10L13/033;G10L13/04;G10L13/10 分类 乐器;声学;
发明人 杨喜鹏;郁霖;陈云琳;江明奇;张旭;殷昊 申请(专利权)人 出门问问(苏州)信息科技有限公司
代理机构 北京乐知新创知识产权代理事务所(普通合伙) 代理人 刘婧
地址 215000 江苏省苏州市苏州工业园区星湖街328号创意产业园4-B404单元
法律状态 -

摘要

摘要 本发明公开了一种歌声合成方法、装置及可读存储介质,该方法包括:获取用户朗诵的音频、音频对应的的歌词文本;根据预设语音识别模型和歌词文本对音频中的第一音素进行时长标注,得到第一音素的第一时长;确定音频的第一谱特征;当歌词文本中的第一歌词和预设目标歌曲的第二歌词对应,根据预设的目标歌曲的第二音素的第二时长、第一音素的第一时长对第一谱特征进行缩放处理,得到第二谱特征;对第二谱特征、预设的目标歌曲的第一基频进行合成,得到合成歌声。本发明无需收集大量的录音数据就可以实现歌声合成,可以降低歌声合成的成本,且合成歌声更加自然,具有目标歌曲原歌手歌唱时的韵律感且能保留用户原有的音色。