一种基于音素的中文语音合成系统
基本信息
申请号 | CN201810938392.4 | 申请日 | - |
公开(公告)号 | CN108899009B | 公开(公告)日 | 2020-07-03 |
申请公布号 | CN108899009B | 申请公布日 | 2020-07-03 |
分类号 | G10L13/08;G10L13/10;G10L13/047 | 分类 | - |
发明人 | 陈宏;房鹏展 | 申请(专利权)人 | 百卓网络科技有限公司 |
代理机构 | 南京瑞弘专利商标事务所(普通合伙) | 代理人 | 百卓网络科技有限公司 |
地址 | 210000 江苏省南京市江北新区惠达路6号北斗大厦2号楼70室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于音素的中文语音合成方法,其特征在于,包括如下步骤:步骤1,对文本与音频进行预处理;步骤2,构造音素集;步骤3,利用one‑hot将音素序列转化为字ID,训练生成转词向量,通过基于encoder‑decoder的Seq2Seq的结构生成频谱序列特征;步骤4,结合频谱序列与音频的语音信息,由声码器合成语音;步骤5,合成的音频分别去除尾部静音,按一定顺序将音频进行拼接。本方法合成的语音更加贴近于真人发音,以及在区分多音字与确定停顿位置上较传统的都有很大提升,最主要的是合成的准确率可以达到95%以上。 |
