神经网络声码器语音合成的方法、装置、设备以及介质
基本信息
申请号 | CN202110545405.3 | 申请日 | - |
公开(公告)号 | CN113345406A | 公开(公告)日 | 2021-09-03 |
申请公布号 | CN113345406A | 申请公布日 | 2021-09-03 |
分类号 | G10L13/02(2013.01)I;G10L19/04(2013.01)I;G10L19/16(2013.01)I;G10L19/26(2013.01)I;G10L25/24(2013.01)I;G10L25/30(2013.01)I | 分类 | 乐器;声学; |
发明人 | 王飞;张李;王欢良;唐浩元;王佳珺;代大明 | 申请(专利权)人 | 苏州奇梦者科技有限公司 |
代理机构 | 苏州铭浩知识产权代理事务所(普通合伙) | 代理人 | 朱斌兵 |
地址 | 215000江苏省苏州市中国(江苏)自由贸易试验区苏州片区苏州工业园区若水路388号E1905室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了神经网络声码器语音合成的方法、装置、设备以及介质,其将音频低频由线性预测滤波器建模生成,将高频细节部分用自回归残差网络补全,同时将自回归残差网络进行补充完善,然后将低频细节和高频细节叠加,最后输出语音,合成的稳定性高,其中的多通道以及一步多点技术增加推理运算效率,另外对RNN结构的块稀疏化、减小自回归的运算量的同时提升矩阵运算计算效率,从而实现了让语音合成提供最佳质量的同时保证高效实,具有参数量低、合成速度快和合成音质高特点,符合实际的使用需求。 |
