自适应语音合成方法、装置、可读存储介质及计算设备
基本信息
申请号 | CN201910661648.6 | 申请日 | - |
公开(公告)号 | CN110379407B | 公开(公告)日 | 2021-10-19 |
申请公布号 | CN110379407B | 申请公布日 | 2021-10-19 |
分类号 | G10L13/02(2013.01)I;G10L13/08(2013.01)I;G10L25/30(2013.01)I | 分类 | 乐器;声学; |
发明人 | 殷昊 | 申请(专利权)人 | 出门问问(苏州)信息科技有限公司 |
代理机构 | 北京鼎承知识产权代理有限公司 | 代理人 | 田恩涛;柯宏达 |
地址 | 215123江苏省苏州市工业园区星湖街328号创意产业园4-B404单元 | ||
法律状态 | - |
摘要
摘要 | 本公开实施例提供了一种自适应语音合成方法、装置、可读存储介质及计算设备,用于在仅有少量的且发音质量不高的语音数据的条件下,合成效果不错的说话人语音。方法包括:获取基础语音数据和基础语音数据对应的文本数据;根据基础语音数据和基础语音数据对应的文本数据,训练基础语音模型;获取说话人的语音数据和说话人的语音数据对应的文本数据;根据说话人的语音数据和说话人的语音数据对应的文本数据,以及基础语音模型,训练GRU语音模型;当接收到语音合成指令时,根据GRU语音模型和指令包含的文字信息,合成说话人的语音。 |
