一种基于生成对抗网络的语音增强方法
基本信息
申请号 | CN201910696224.3 | 申请日 | - |
公开(公告)号 | CN110428849B | 公开(公告)日 | 2021-10-08 |
申请公布号 | CN110428849B | 申请公布日 | 2021-10-08 |
分类号 | G10L21/0208;G10L21/0216;G10L25/03;G10L25/30 | 分类 | 乐器;声学; |
发明人 | 殷绪成;赵力;杨春 | 申请(专利权)人 | 珠海亿智电子科技有限公司 |
代理机构 | 广州科粤专利商标代理有限公司 | 代理人 | 邓潮彬;黄培智 |
地址 | 519080 广东省珠海市高新区唐家湾镇港乐路8号大洲科技园B区905 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于生成对抗网络的语音增强方法,其特征在于,包括以下步骤:步骤1、采用渐进式训练方式,重建纯净语音的分布;步骤2、采用基于判别器的特征匹配策略,优化生成器的增强性能;步骤3、采用若干种噪声类型数据进行训练,以生成对抗网络。本发明将基于判别器的特征匹配与传统的特征映射方法相结合,有效减少了增强后语音的特征分布与纯净语音特征分布的差异。此外,还采用GAN目标函数对网络进行了联合优化训练,使生成器和判别器之间的损失达到最小。 |
