语音合成方法、装置、电子设备以及计算机可读存储介质
基本信息
申请号 | CN202110783989.8 | 申请日 | - |
公开(公告)号 | CN113409761A | 公开(公告)日 | 2021-09-17 |
申请公布号 | CN113409761A | 申请公布日 | 2021-09-17 |
分类号 | G10L13/02(2013.01)I;G10L13/04(2013.01)I;G10L13/10(2013.01)I;G10L25/18(2013.01)I;G10L25/21(2013.01)I | 分类 | 乐器;声学; |
发明人 | 叶剑豪;苏志霸;周鸿斌;林怡亭;李林;任凯盟;贺天威;贺雯迪;卢恒 | 申请(专利权)人 | 上海喜马拉雅科技有限公司 |
代理机构 | 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人 | 张欣欣 |
地址 | 201100上海市闵行区紫星路588号2幢2062室 | ||
法律状态 | - |
摘要
摘要 | 本发明的实施例提供了一种语音合成方法、装置、电子设备以及计算机可读存储介质,方法包括:确定待合成文本;将待合成文本转化为待合成国际音标对应的第一ID序列和国际音标对应的声调ID;确定用户选择的目标对象的ID和标准对象的ID;输入至语音合成模型中语音合成模型,依据待合成文本的待合成国际音标序列,预测每个待合成国际音标的时长,语音合成模型根据待合成国际音标对应的第一ID序列、国际音标对应的声调ID、每个待合成国际音标的时长、目标对象的ID以及标准对象的ID进行处理,输出待合成文本的声学特征。能够使得对象在合成非本土语言的时候,能够使用本土说话人,即标准对象的韵律,最终得到更好的语音合成自然度。 |
