一种语种识别方法及系统

基本信息

申请号 CN202011338189.7 申请日 -
公开(公告)号 CN112530407B 公开(公告)日 2021-07-23
申请公布号 CN112530407B 申请公布日 2021-07-23
分类号 G10L15/00(2013.01)I;G10L25/03(2013.01)I;G10L25/24(2013.01)I;G10L25/78(2013.01)I;G10L15/20(2006.01)I 分类 乐器;声学;
发明人 马杰 申请(专利权)人 北京快鱼电子股份公司
代理机构 北京天盾知识产权代理有限公司 代理人 张彩珍
地址 100195北京市海淀区闵庄路3号清华科技园玉泉慧谷11栋
法律状态 -

摘要

摘要 本发明为一种语种识别方法及系统,包括S0:建立背景噪音库和人声数据库;S100:基于背景噪音库对人声数据库中语音数据进行预处理;S200:对预处理后的语音数据进行VAD检测,提取活动语音数据的MFCC特征向量,建立人声GMM模型;S300:对背景噪音库中噪音数据进行VAD检测,提取所述活动噪音数据的MFCC特征向量,建立噪音GMM模型;S400:基于活动语音数据MFCC特征向量,建立GMM‑ivector语种识别模型,并生成语种特征库;S500:对待测声音数据进行VAD检测并提取MFCC特征向量,基于人声GMM模型和噪音GMM模型判断待测声音数据是否为人声信号;S600:若判断待测声音数据为人声信号,则用所述GMM‑ivector语种识别模型提取该待测声音数据的ivector特征,进行语种识别。本发明可稳定识别语种,增强鲁棒性。