基于生成对抗网络的语音增强方法及系统

基本信息

申请号 CN202210301250.3 申请日 -
公开(公告)号 CN114664318A 公开(公告)日 2022-06-24
申请公布号 CN114664318A 申请公布日 2022-06-24
分类号 G10L21/0208(2013.01)I;G10L25/30(2013.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 乐器;声学;
发明人 汪付强;袁从刚;夏源;张鹏;吴晓明;张建强;刘祥志;郝秋赟;马晓凤 申请(专利权)人 山东省计算中心(国家超级计算济南中心)
代理机构 济南圣达知识产权代理有限公司 代理人 -
地址 250014山东省济南市历下区科院路19号
法律状态 -

摘要

摘要 本发明公开了基于生成对抗网络的语音增强方法及系统,包括:获取带噪声语音信号;将带噪声语音信号,输入到训练后的生成对抗网络中,输出增强后的语音信号;其中,所述生成对抗网络,包括两个生成器和两个判别器;所述生成对抗网络,训练过程中通过对两个生成器与两个判别器的相互博弈,提升生成器逼近目标信号的能力。本发明充分考虑了语音信号的时序关系,改进了先前的生成器与判别器的全卷积的设计,生成器中添加使用多头注意力机制,并将多生成器多阶段增强与注意力机制相结合,充分利用了多头注意力机制与生成对抗网络博弈思想。本方法能够是增强后的语音具有更高的质量与可懂度。