一种基于深度学习的空中管制中英文语音判别方法

基本信息

申请号 CN201910654299.5 申请日 -
公开(公告)号 CN110473520A 公开(公告)日 2019-11-19
申请公布号 CN110473520A 申请公布日 2019-11-19
分类号 G10L15/06(2013.01)I; G10L15/16(2006.01)I; G10L15/00(2013.01)I 分类 乐器;声学;
发明人 王耀彬 申请(专利权)人 上海麦图信息科技有限公司
代理机构 - 代理人 -
地址 200000 上海市徐汇区桂平路680号32幢527-1室
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习的空中管制中英文语音判别方法,包括以下步骤:获取待判别的语音信号,并将其转换为16bit 16kHz的PCM音频数据;建立深度网络模型;利用训练数据训深度网络模型得到中英文语音判别引擎;其中,深度网络模型使用深度残差卷积模块作为特征提取器,并由reshape层和全连接层对提取的特征数据进行处理,最终通过softmax分类器进行分类学习,获得判别结果。本发明采用以人工智能深度学习引擎为核心,具有极强的专业适用性和口音泛化能力,数据量依赖程度更低的优点,在空管中英文语音的语言判别上表现优异。