中文语音合成模型训练方法、装置、电子设备和存储介质

基本信息

申请号 CN202111641722.1 申请日 -
公开(公告)号 CN114220413A 公开(公告)日 2022-03-22
申请公布号 CN114220413A 申请公布日 2022-03-22
分类号 G10L13/02(2013.01)I;G10L13/08(2013.01)I;G10L13/10(2013.01)I;G10L19/04(2013.01)I;G10L25/18(2013.01)I;G10L25/30(2013.01)I;G06F40/189(2020.01)I 分类 乐器;声学;
发明人 付景川 申请(专利权)人 达闼机器人股份有限公司
代理机构 北京智晨知识产权代理有限公司 代理人 张婧
地址 200245上海市闵行区中青路207号8幢
法律状态 -

摘要

摘要 本发明涉及人工智能领域,公开了一种中文语音合成模型的训练方法、装置、电子设备和存储介质。本发明中,该中文语音合成模型的训练方法,包括:提取预设中文语音数据集中每条中文语音的音素信息、音调信息和梅尔谱;其中,音调信息中的每个音调元素为音素信息中的音素元素对应的音调;基于预设算法训练预设的学习模型,并将训练完成的学习模型作为中文语音合成模型;其中,学习模型的训练数据包括提取的音素信息、音调信息和梅尔谱。能够提高中文语音合成模型的准确度,降低中文语音合成时出现音调错误的概率。