一种具有自适应降噪能力的语音识别方法及装置
基本信息
申请号 | CN202110436095.1 | 申请日 | - |
公开(公告)号 | CN113205803A | 公开(公告)日 | 2021-08-03 |
申请公布号 | CN113205803A | 申请公布日 | 2021-08-03 |
分类号 | G10L15/20;G10L15/16;G10L15/06;G10L15/02 | 分类 | 乐器;声学; |
发明人 | 杨韬育;徐涛;牟杰 | 申请(专利权)人 | 上海顺久电子科技有限公司 |
代理机构 | 北京同达信恒知识产权代理有限公司 | 代理人 | 黄志华 |
地址 | 201203 上海市浦东新区华佗路68号创业源北区7号楼2层顺久电子 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种具有自适应降噪能力的语音识别方法及装置,该方法包括获取语音采集设备采集的语音信号,对语音信号进行处理,得到语音特征向量矩阵,将语音特征向量矩阵输入到训练好的级联卷积神经网络中进行降噪和语音识别,得到语音信号对应的识别结果,其中,训练好的级联卷积神经网络是对包含有噪声的语音信号的训练集进行训练得到的。通过部署级联的卷积神经网络,无需添加额外的降噪模块,即可实现降噪和语音识别功能,在识别分类过程中,神经网络依然能学习到降噪过程中分离得到的噪声信号特征。通过这种方式使有效特征不会丢失,同时信号处理的实时性更高,语音识别系统对噪声有更强的鲁棒性,噪声情况下的识别率会有明显提升。 |
