一种生成个性化音色的歌唱合成方法、装置及存储介质

基本信息

申请号 CN202210434225.2 申请日 -
公开(公告)号 CN114724539A 公开(公告)日 2022-07-08
申请公布号 CN114724539A 申请公布日 2022-07-08
分类号 G10L13/033(2013.01)I;G10L25/18(2013.01)I;G10L21/007(2013.01)I;G10L25/30(2013.01)I;G10L25/24(2013.01)I 分类 乐器;声学;
发明人 尹学渊;肖钦引;刘鑫忠 申请(专利权)人 成都龙渊网络科技有限公司
代理机构 成都睿道专利代理事务所(普通合伙) 代理人 -
地址 610000四川省成都市高新区益州大道中段722号1栋1单元12层1210号
法律状态 -

摘要

摘要 本发明涉及语音信号处理及人工智能技术领域,具体而言,涉及一种生成个性化音色的歌唱合成方法、装置及存储介质,该方法的步骤包括:获取历史声学特征数据,建立声学特征训练模型,通过历史声学特征数据对声学特征训练模型进行训练,得到完成训练的声学特征训练模型;输入设定声学特征数据,经预处理后,得到音素数据序列,根据音素的持续时间对音素进行扩充,形成音素扩充序列,对音素扩充序列进行处理,使其与设定声学特征数据的长度一致,之后整合并输入至完成训练的声学特征训练模型内进行计算,得到声谱图,通过声码器对声谱图进行合成,完成个性化音色的生成,其中,音素数据序列包括各个音素的持续时间与音高。