高保真的智能客服语音合成方法

基本信息

申请号 CN201811584612.4 申请日 -
公开(公告)号 CN109686358A 公开(公告)日 2019-04-26
申请公布号 CN109686358A 申请公布日 2019-04-26
分类号 G10L13/02(2013.01)I; G10L13/08(2013.01)I; G10L13/10(2013.01)I 分类 乐器;声学;
发明人 刘嗣平; 柯登峰; 陈孟达; 贾宇康 申请(专利权)人 广州九四智能科技有限公司
代理机构 北京联瑞联丰知识产权代理事务所(普通合伙) 代理人 广州九四智能科技有限公司
地址 510000 广东省广州市天河区棠下二社涌边路69号1007B房
法律状态 -

摘要

摘要 本发明公开了一种高保真的智能客服语音合成方法,包括:进行语音的录制;建立初始语料库;对录制好的语音进行强制对齐;进行语音切割得到三音子模型;利用三音子模型形成目标语料库;对于切割好的三音子基元计算似然;建立三音子决策树;根据所需合成文本选择合适的三音子基元;对选择的三音子基元,针对原始语音波形做基音同步标注;对原始语音波形的基音曲线与目标基音曲线建立映射,得到短时合成信号序列;将短时信号序列与目标基音周期同步排列,重叠相加得到拼接合成的语音;将合成的语音插入到提前录制好的语音中。本发明不必让客服人员录制大量重复类似的含有变量的语音,能够降低语音录制成本,还能提升整个对话过程的流畅性与自然度。