一种基于深度学习的空中管制中英文语音判别方法
基本信息
申请号 | CN201910654299.5 | 申请日 | - |
公开(公告)号 | CN110473520A | 公开(公告)日 | 2019-11-19 |
申请公布号 | CN110473520A | 申请公布日 | 2019-11-19 |
分类号 | G10L15/06(2013.01)I; G10L15/16(2006.01)I; G10L15/00(2013.01)I | 分类 | 乐器;声学; |
发明人 | 王耀彬 | 申请(专利权)人 | 上海麦图信息科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 200000 上海市徐汇区桂平路680号32幢527-1室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于深度学习的空中管制中英文语音判别方法,包括以下步骤:获取待判别的语音信号,并将其转换为16bit 16kHz的PCM音频数据;建立深度网络模型;利用训练数据训深度网络模型得到中英文语音判别引擎;其中,深度网络模型使用深度残差卷积模块作为特征提取器,并由reshape层和全连接层对提取的特征数据进行处理,最终通过softmax分类器进行分类学习,获得判别结果。本发明采用以人工智能深度学习引擎为核心,具有极强的专业适用性和口音泛化能力,数据量依赖程度更低的优点,在空管中英文语音的语言判别上表现优异。 |
