语音合成模型的训练与语音合成方法、装置、系统及介质

基本信息

申请号 CN202110452252.8 申请日 -
公开(公告)号 CN113241056A 公开(公告)日 2021-08-10
申请公布号 CN113241056A 申请公布日 2021-08-10
分类号 G10L13/047(2013.01)I;G10L13/08(2013.01)I;G10L25/51(2013.01)I;G01H17/00(2006.01)I;H04L29/08(2006.01)I 分类 乐器;声学;
发明人 李世龙;钟彩桂;李秀林 申请(专利权)人 标贝(北京)科技有限公司
代理机构 北京睿邦知识产权代理事务所(普通合伙) 代理人 徐丁峰;戴亚南
地址 100192北京市海淀区西小口路66号中关村东升科技园·北领地B-2号楼2层A203A(东升地区)
法律状态 -

摘要

摘要 本发明提供一种个性化语音合成模型的训练方法、装置、系统及存储介质与一种语音合成方法、装置、系统及存储介质。训练方法包括:接收复刻客户端直接或经由复刻业务服务器发送的目标用户的用户录音文件;调度容器集群中的动态新增的特定计算节点;通过特定计算节点从镜像仓库中拉取训练镜像,其中,训练镜像通过打包标准语音合成模型的训练环境生成,标准语音合成模型基于样本录音文件和对应的样本文本进行训练;在特定计算节点上运行训练镜像以展开训练环境;在特定计算节点上利用训练环境和用户录音文件进行语音合成模型训练,以获得专属于目标用户的个性化语音合成模型。可实现模型训练时的计算力的自动扩展,可支持大规模的自动化训练任务。