一种基于深度学习的空中管制语音降噪方法

基本信息

申请号 CN202110413991.6 申请日 -
公开(公告)号 CN113129919A 公开(公告)日 2021-07-16
申请公布号 CN113129919A 申请公布日 2021-07-16
分类号 G10L21/0208(2013.01)I;G10L21/0224(2013.01)I;G10L21/0232(2013.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I 分类 乐器;声学;
发明人 顾毅陶;李鑫;王宏锋 申请(专利权)人 上海麦图信息科技有限公司
代理机构 - 代理人 -
地址 200000上海市徐汇区桂平路680号32幢527-1室
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习的空中管制语音降噪方法,步骤如下:获取待降噪音频,将其转换为16bit/16kHz的PCM音频数据,并通过短时傅里叶变换由时域转换为频域;建立深度网络模型;建立空管音频训练数据集和标签数据集;利用训练数据训练深度网络模型得到降噪模型;待降噪音频经短时傅里叶变换后输入到降噪模型,并与短时傅里叶变换分离得到的相位信息进行点积操作,然后通过逆短时傅里叶变换生成降噪音频。本发明深度网络模型使用带有长连接的Encoder‑Decoder模型来进行特征提取,并且通过1X1卷积核对提取的特征数据进行处理,生成降噪语音。本发明具有极强的降噪能力和泛化能力,降噪后的音频能保留较高的信噪比。