自适应语音合成方法、装置、可读存储介质及计算设备

基本信息

申请号 CN201910661648.6 申请日 -
公开(公告)号 CN110379407B 公开(公告)日 2021-10-19
申请公布号 CN110379407B 申请公布日 2021-10-19
分类号 G10L13/02(2013.01)I;G10L13/08(2013.01)I;G10L25/30(2013.01)I 分类 乐器;声学;
发明人 殷昊 申请(专利权)人 出门问问(苏州)信息科技有限公司
代理机构 北京鼎承知识产权代理有限公司 代理人 田恩涛;柯宏达
地址 215123江苏省苏州市工业园区星湖街328号创意产业园4-B404单元
法律状态 -

摘要

摘要 本公开实施例提供了一种自适应语音合成方法、装置、可读存储介质及计算设备,用于在仅有少量的且发音质量不高的语音数据的条件下,合成效果不错的说话人语音。方法包括:获取基础语音数据和基础语音数据对应的文本数据;根据基础语音数据和基础语音数据对应的文本数据,训练基础语音模型;获取说话人的语音数据和说话人的语音数据对应的文本数据;根据说话人的语音数据和说话人的语音数据对应的文本数据,以及基础语音模型,训练GRU语音模型;当接收到语音合成指令时,根据GRU语音模型和指令包含的文字信息,合成说话人的语音。