一种基于深度学习的空中管制语音指令识别方法专利查询专利号|摘要-满商公司网

一种基于深度学习的空中管制语音指令识别方法

基本信息

申请号	CN201910619285.X	申请日	-
公开（公告）号	CN110415683A	公开（公告）日	2019-11-05
申请公布号	CN110415683A	申请公布日	2019-11-05
分类号	G10L15/02（2006.01）I; G10L15/04（2013.01）I; G10L15/06（2013.01）I; G10L15/16（2006.01）I; G10L15/26（2006.01）I	分类	乐器；声学;
发明人	王耀彬	申请（专利权）人	上海麦图信息科技有限公司
代理机构	-	代理人	-
地址	200000 上海市徐汇区桂平路680号32幢527-1室
法律状态	-

摘要

本发明公开了一种基于深度学习的空中管制语音指令识别方法，包括以下步骤：获取待识别的语音信号，并将其转换为16bit 16kHz的PCM音频数据；建立深度网络模型；利用训练数据训深度网络模型得到语音识别引擎；对所述音频数据进行语音切分；将语音切分得到的有效音频片段输入语音识别引擎，输出文字识别结果。其中，深度网络模型使用卷积模块作为特征提取器，并由reshape层和全连接层对提取的特征数据进行处理，利用门控循环单元进行序列学习，最终通过全连接层进行分类学习与决策，获得预测结果。本发明采用以人工智能深度学习引擎为核心，具有极强的专业适用性和口音泛化能力，数据量依赖程度更低的有点，在空管语音的识别上显著优于通用语音识别系统。