一种可控制韵律情感的语音合成方法、装置、存储介质
基本信息
申请号 | CN201910706204.X | 申请日 | - |
公开(公告)号 | CN110299131B | 公开(公告)日 | 2021-12-10 |
申请公布号 | CN110299131B | 申请公布日 | 2021-12-10 |
分类号 | G10L13/10 | 分类 | 乐器;声学; |
发明人 | 王欢良;王飞;张李;沈文武;代大明 | 申请(专利权)人 | 苏州奇梦者科技有限公司 |
代理机构 | 苏州国诚专利代理有限公司 | 代理人 | 陈松 |
地址 | 215024 江苏省苏州市工业园区若水路388号纳米技术国家大学科技园E栋1604 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种可控制韵律情感的语音合成方法、装置、存储介质,其可以在合成语音中添加韵律情感,有效控制合成语音的韵律节奏,方法包括以下步骤:将待合成文本对应的字符转化为字符表示向量;将字符表示向量与和韵律节奏向量进行拼接,然后输入编码器,输出编码特征向量;将编码特征向量与韵律节奏向量拼接,通过注意力机制,生成注意力向量;将前一时刻的预测出的频谱帧与注意力向量做拼接,送入解码器,通过解码器的输出更新注意力向量,新计算出来的注意力向量与解码器输出做拼接,送入投影层输出带有韵律节奏的预测语音频谱,同时预测频谱生成的结束点;将带有韵律节奏的预测语音频谱转化成带有韵律节奏的语音输出。 |
