一种基于深度学习的空中管制语音降噪方法
基本信息
申请号 | CN202110413991.6 | 申请日 | - |
公开(公告)号 | CN113129919A | 公开(公告)日 | 2021-07-16 |
申请公布号 | CN113129919A | 申请公布日 | 2021-07-16 |
分类号 | G10L21/0208(2013.01)I;G10L21/0224(2013.01)I;G10L21/0232(2013.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I | 分类 | 乐器;声学; |
发明人 | 顾毅陶;李鑫;王宏锋 | 申请(专利权)人 | 上海麦图信息科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 200000上海市徐汇区桂平路680号32幢527-1室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于深度学习的空中管制语音降噪方法,步骤如下:获取待降噪音频,将其转换为16bit/16kHz的PCM音频数据,并通过短时傅里叶变换由时域转换为频域;建立深度网络模型;建立空管音频训练数据集和标签数据集;利用训练数据训练深度网络模型得到降噪模型;待降噪音频经短时傅里叶变换后输入到降噪模型,并与短时傅里叶变换分离得到的相位信息进行点积操作,然后通过逆短时傅里叶变换生成降噪音频。本发明深度网络模型使用带有长连接的Encoder‑Decoder模型来进行特征提取,并且通过1X1卷积核对提取的特征数据进行处理,生成降噪语音。本发明具有极强的降噪能力和泛化能力,降噪后的音频能保留较高的信噪比。 |
