一种基于深度学习的空中管制语音指令识别方法

基本信息

申请号 CN201910619285.X 申请日 -
公开(公告)号 CN110415683A 公开(公告)日 2019-11-05
申请公布号 CN110415683A 申请公布日 2019-11-05
分类号 G10L15/02(2006.01)I; G10L15/04(2013.01)I; G10L15/06(2013.01)I; G10L15/16(2006.01)I; G10L15/26(2006.01)I 分类 乐器;声学;
发明人 王耀彬 申请(专利权)人 上海麦图信息科技有限公司
代理机构 - 代理人 -
地址 200000 上海市徐汇区桂平路680号32幢527-1室
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习的空中管制语音指令识别方法,包括以下步骤:获取待识别的语音信号,并将其转换为16bit 16kHz的PCM音频数据;建立深度网络模型;利用训练数据训深度网络模型得到语音识别引擎;对所述音频数据进行语音切分;将语音切分得到的有效音频片段输入语音识别引擎,输出文字识别结果。其中,深度网络模型使用卷积模块作为特征提取器,并由reshape层和全连接层对提取的特征数据进行处理,利用门控循环单元进行序列学习,最终通过全连接层进行分类学习与决策,获得预测结果。本发明采用以人工智能深度学习引擎为核心,具有极强的专业适用性和口音泛化能力,数据量依赖程度更低的有点,在空管语音的识别上显著优于通用语音识别系统。