用于语音合成模型训练的交互方法、装置、系统及介质

基本信息

申请号 CN202110452288.6 申请日 -
公开(公告)号 CN113241057A 公开(公告)日 2021-08-10
申请公布号 CN113241057A 申请公布日 2021-08-10
分类号 G10L13/047(2013.01)I;G10L13/08(2013.01)I;G10L25/51(2013.01)I;G01H17/00(2006.01)I;H04L29/08(2006.01)I 分类 乐器;声学;
发明人 胡帅君;边会康;李世龙;李秀林 申请(专利权)人 标贝(北京)科技有限公司
代理机构 北京睿邦知识产权代理事务所(普通合伙) 代理人 徐丁峰;戴亚南
地址 100192北京市海淀区西小口路66号中关村东升科技园·北领地B-2号楼2层A203A(东升地区)
法律状态 -

摘要

摘要 本发明提供一种用于实现个性化语音合成模型训练的交互方法、装置、系统及存储介质。方法包括:从复刻业务服务器获取用户训练文本;输出用户训练文本;采集目标用户的语音,以获得用户录音文件;在用户训练文本所包含的文字信息与用户录音文件所表达的文字信息相匹配的情况下,将用户录音文件直接或经由复刻业务服务器上传到模型训练服务器,以在模型训练服务器上基于用户录音文件训练专属于目标用户的个性化语音合成模型;从模型训练服务器直接或经由复刻业务服务器接收个性化语音合成模型的训练结果信息;基于训练结果信息输出关于个性化语音合成模型的训练是否完成的反馈信息。使得客户端(或客户端上的目标应用)具备支持声音复刻的能力。