一种引入外部数据校正的空中管制语音识别方法

基本信息

申请号 CN202010114470.6 申请日 -
公开(公告)号 CN111243591A 公开(公告)日 2020-06-05
申请公布号 CN111243591A 申请公布日 2020-06-05
分类号 G10L15/22(2006.01)I 分类 乐器;声学;
发明人 王耀彬;李鑫 申请(专利权)人 上海麦图信息科技有限公司
代理机构 - 代理人 -
地址 200000上海市徐汇区桂平路680号32幢527-1室
法律状态 -

摘要

摘要 本发明公开了一种引入外部数据校正的空中管制语音识别方法,包含数据预处理模块、语音识别模型和外部数据校正模型;数据预处理模块将原始语音数据和外部信息数据(航班列表)转化为输入语音识别模型和外部数据校正模型的数据;语音识别模型包含深度残差卷积模块、深度残差序列学习模块和全连接层,预处理后的语音信号依次经深度残差卷积模块、深度残差序列学习模块、全连接层生成多层次语音通道信息特征、高层次特征序列、文字序列。外部数据校正模型将预处理后的外部信息数据与语音识别模型中的高层次序列特征数据相融合,通过注意力机制计算语音中的航班号以校正语音识别结果中的航班号,从而提高语音识别准确率和航班号识别准确率。