一种基于深度学习的空中管制语音指令识别方法
基本信息
申请号 | CN201910619285.X | 申请日 | - |
公开(公告)号 | CN110415683A | 公开(公告)日 | 2019-11-05 |
申请公布号 | CN110415683A | 申请公布日 | 2019-11-05 |
分类号 | G10L15/02(2006.01)I; G10L15/04(2013.01)I; G10L15/06(2013.01)I; G10L15/16(2006.01)I; G10L15/26(2006.01)I | 分类 | 乐器;声学; |
发明人 | 王耀彬 | 申请(专利权)人 | 上海麦图信息科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 200000 上海市徐汇区桂平路680号32幢527-1室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于深度学习的空中管制语音指令识别方法,包括以下步骤:获取待识别的语音信号,并将其转换为16bit 16kHz的PCM音频数据;建立深度网络模型;利用训练数据训深度网络模型得到语音识别引擎;对所述音频数据进行语音切分;将语音切分得到的有效音频片段输入语音识别引擎,输出文字识别结果。其中,深度网络模型使用卷积模块作为特征提取器,并由reshape层和全连接层对提取的特征数据进行处理,利用门控循环单元进行序列学习,最终通过全连接层进行分类学习与决策,获得预测结果。本发明采用以人工智能深度学习引擎为核心,具有极强的专业适用性和口音泛化能力,数据量依赖程度更低的有点,在空管语音的识别上显著优于通用语音识别系统。 |
