一种将文本转换成语音的方法、系统、装置和存储介质
基本信息
申请号 | CN202010079855.3 | 申请日 | - |
公开(公告)号 | CN111145720A | 公开(公告)日 | 2020-05-12 |
申请公布号 | CN111145720A | 申请公布日 | 2020-05-12 |
分类号 | G10L13/02;G10L13/033;G10L25/24;G10L25/03;G10L25/30;G10L25/60 | 分类 | 乐器;声学; |
发明人 | 叶俊杰;李权;王伦基;黄桂芳;任勇;韩蓝青 | 申请(专利权)人 | 清华珠三角研究院 |
代理机构 | 广州嘉权专利商标事务所有限公司 | 代理人 | 赛业(广州)生物科技有限公司;清华珠三角研究院 |
地址 | 510530 广东省广州市黄埔区香雪八路98号香雪国际公寓F栋 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种将文本转换成语音的方法、系统、装置和存储介质,所述方法包括获取测试文本和待迁移语音,获取所述测试文本的发音编码,使用经过训练的语音风格编码器,获取所述待迁移语音的风格编码,将所述发音编码和风格编码进行拼接,以及使用语音解码器对所述拼接的结果进行解码从而获得语音等步骤。通过使用语音风格编码器,可以提取待迁移语音的风格,然后将其融入到测试文本的发音中,使得最终获得的语音具有与测试文本相同的内容,以及与待迁移语音相同的风格,实现从文本到具有一定风格的语音的转换。并且,本发明可以较低成本取得训练集,用于对所述语音风格编码器进行训练,从而降低使用成本。本发明广泛应用于语音数据技术领域。 |
