基于生成对抗网络的语音增强方法及系统
基本信息
申请号 | CN202210301250.3 | 申请日 | - |
公开(公告)号 | CN114664318A | 公开(公告)日 | 2022-06-24 |
申请公布号 | CN114664318A | 申请公布日 | 2022-06-24 |
分类号 | G10L21/0208(2013.01)I;G10L25/30(2013.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 乐器;声学; |
发明人 | 汪付强;袁从刚;夏源;张鹏;吴晓明;张建强;刘祥志;郝秋赟;马晓凤 | 申请(专利权)人 | 山东省计算中心(国家超级计算济南中心) |
代理机构 | 济南圣达知识产权代理有限公司 | 代理人 | - |
地址 | 250014山东省济南市历下区科院路19号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了基于生成对抗网络的语音增强方法及系统,包括:获取带噪声语音信号;将带噪声语音信号,输入到训练后的生成对抗网络中,输出增强后的语音信号;其中,所述生成对抗网络,包括两个生成器和两个判别器;所述生成对抗网络,训练过程中通过对两个生成器与两个判别器的相互博弈,提升生成器逼近目标信号的能力。本发明充分考虑了语音信号的时序关系,改进了先前的生成器与判别器的全卷积的设计,生成器中添加使用多头注意力机制,并将多生成器多阶段增强与注意力机制相结合,充分利用了多头注意力机制与生成对抗网络博弈思想。本方法能够是增强后的语音具有更高的质量与可懂度。 |
