一种基于深度学习的空中管制语音降噪方法专利查询专利号|摘要-满商公司网

一种基于深度学习的空中管制语音降噪方法

基本信息

申请号	CN202110413991.6	申请日	-
公开（公告）号	CN113129919A	公开（公告）日	2021-07-16
申请公布号	CN113129919A	申请公布日	2021-07-16
分类号	G10L21/0208（2013.01）I;G10L21/0224（2013.01）I;G10L21/0232（2013.01）I;G06N3/08（2006.01）I;G06N3/04（2006.01）I	分类	乐器；声学;
发明人	顾毅陶;李鑫;王宏锋	申请（专利权）人	上海麦图信息科技有限公司
代理机构	-	代理人	-
地址	200000上海市徐汇区桂平路680号32幢527-1室
法律状态	-

摘要

本发明公开了一种基于深度学习的空中管制语音降噪方法，步骤如下：获取待降噪音频，将其转换为16bit/16kHz的PCM音频数据，并通过短时傅里叶变换由时域转换为频域；建立深度网络模型；建立空管音频训练数据集和标签数据集；利用训练数据训练深度网络模型得到降噪模型；待降噪音频经短时傅里叶变换后输入到降噪模型，并与短时傅里叶变换分离得到的相位信息进行点积操作，然后通过逆短时傅里叶变换生成降噪音频。本发明深度网络模型使用带有长连接的Encoder‑Decoder模型来进行特征提取，并且通过1X1卷积核对提取的特征数据进行处理，生成降噪语音。本发明具有极强的降噪能力和泛化能力，降噪后的音频能保留较高的信噪比。