一种基于音素的中文语音合成系统

基本信息

申请号 CN201810938392.4 申请日 -
公开(公告)号 CN108899009B 公开(公告)日 2020-07-03
申请公布号 CN108899009B 申请公布日 2020-07-03
分类号 G10L13/08;G10L13/10;G10L13/047 分类 -
发明人 陈宏;房鹏展 申请(专利权)人 百卓网络科技有限公司
代理机构 南京瑞弘专利商标事务所(普通合伙) 代理人 百卓网络科技有限公司
地址 210000 江苏省南京市江北新区惠达路6号北斗大厦2号楼70室
法律状态 -

摘要

摘要 本发明公开了一种基于音素的中文语音合成方法,其特征在于,包括如下步骤:步骤1,对文本与音频进行预处理;步骤2,构造音素集;步骤3,利用one‑hot将音素序列转化为字ID,训练生成转词向量,通过基于encoder‑decoder的Seq2Seq的结构生成频谱序列特征;步骤4,结合频谱序列与音频的语音信息,由声码器合成语音;步骤5,合成的音频分别去除尾部静音,按一定顺序将音频进行拼接。本方法合成的语音更加贴近于真人发音,以及在区分多音字与确定停顿位置上较传统的都有很大提升,最主要的是合成的准确率可以达到95%以上。