神经网络声码器语音合成的方法、装置、设备以及介质

基本信息

申请号 CN202110545405.3 申请日 -
公开(公告)号 CN113345406A 公开(公告)日 2021-09-03
申请公布号 CN113345406A 申请公布日 2021-09-03
分类号 G10L13/02(2013.01)I;G10L19/04(2013.01)I;G10L19/16(2013.01)I;G10L19/26(2013.01)I;G10L25/24(2013.01)I;G10L25/30(2013.01)I 分类 乐器;声学;
发明人 王飞;张李;王欢良;唐浩元;王佳珺;代大明 申请(专利权)人 苏州奇梦者科技有限公司
代理机构 苏州铭浩知识产权代理事务所(普通合伙) 代理人 朱斌兵
地址 215000江苏省苏州市中国(江苏)自由贸易试验区苏州片区苏州工业园区若水路388号E1905室
法律状态 -

摘要

摘要 本发明公开了神经网络声码器语音合成的方法、装置、设备以及介质,其将音频低频由线性预测滤波器建模生成,将高频细节部分用自回归残差网络补全,同时将自回归残差网络进行补充完善,然后将低频细节和高频细节叠加,最后输出语音,合成的稳定性高,其中的多通道以及一步多点技术增加推理运算效率,另外对RNN结构的块稀疏化、减小自回归的运算量的同时提升矩阵运算计算效率,从而实现了让语音合成提供最佳质量的同时保证高效实,具有参数量低、合成速度快和合成音质高特点,符合实际的使用需求。