高保真的智能客服语音合成方法
基本信息
申请号 | CN201811584612.4 | 申请日 | - |
公开(公告)号 | CN109686358A | 公开(公告)日 | 2019-04-26 |
申请公布号 | CN109686358A | 申请公布日 | 2019-04-26 |
分类号 | G10L13/02(2013.01)I; G10L13/08(2013.01)I; G10L13/10(2013.01)I | 分类 | 乐器;声学; |
发明人 | 刘嗣平; 柯登峰; 陈孟达; 贾宇康 | 申请(专利权)人 | 广州九四智能科技有限公司 |
代理机构 | 北京联瑞联丰知识产权代理事务所(普通合伙) | 代理人 | 广州九四智能科技有限公司 |
地址 | 510000 广东省广州市天河区棠下二社涌边路69号1007B房 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种高保真的智能客服语音合成方法,包括:进行语音的录制;建立初始语料库;对录制好的语音进行强制对齐;进行语音切割得到三音子模型;利用三音子模型形成目标语料库;对于切割好的三音子基元计算似然;建立三音子决策树;根据所需合成文本选择合适的三音子基元;对选择的三音子基元,针对原始语音波形做基音同步标注;对原始语音波形的基音曲线与目标基音曲线建立映射,得到短时合成信号序列;将短时信号序列与目标基音周期同步排列,重叠相加得到拼接合成的语音;将合成的语音插入到提前录制好的语音中。本发明不必让客服人员录制大量重复类似的含有变量的语音,能够降低语音录制成本,还能提升整个对话过程的流畅性与自然度。 |
