一种基于生成对抗网络的语音增强方法

基本信息

申请号 CN201910696224.3 申请日 -
公开(公告)号 CN110428849B 公开(公告)日 2021-10-08
申请公布号 CN110428849B 申请公布日 2021-10-08
分类号 G10L21/0208;G10L21/0216;G10L25/03;G10L25/30 分类 乐器;声学;
发明人 殷绪成;赵力;杨春 申请(专利权)人 珠海亿智电子科技有限公司
代理机构 广州科粤专利商标代理有限公司 代理人 邓潮彬;黄培智
地址 519080 广东省珠海市高新区唐家湾镇港乐路8号大洲科技园B区905
法律状态 -

摘要

摘要 本发明公开了一种基于生成对抗网络的语音增强方法,其特征在于,包括以下步骤:步骤1、采用渐进式训练方式,重建纯净语音的分布;步骤2、采用基于判别器的特征匹配策略,优化生成器的增强性能;步骤3、采用若干种噪声类型数据进行训练,以生成对抗网络。本发明将基于判别器的特征匹配与传统的特征映射方法相结合,有效减少了增强后语音的特征分布与纯净语音特征分布的差异。此外,还采用GAN目标函数对网络进行了联合优化训练,使生成器和判别器之间的损失达到最小。