一种语种识别方法及系统专利查询专利号|摘要-满商公司网

一种语种识别方法及系统

基本信息

申请号	CN202011338189.7	申请日	-
公开（公告）号	CN112530407B	公开（公告）日	2021-07-23
申请公布号	CN112530407B	申请公布日	2021-07-23
分类号	G10L15/00（2013.01）I;G10L25/03（2013.01）I;G10L25/24（2013.01）I;G10L25/78（2013.01）I;G10L15/20（2006.01）I	分类	乐器；声学;
发明人	马杰	申请（专利权）人	北京快鱼电子股份公司
代理机构	北京天盾知识产权代理有限公司	代理人	张彩珍
地址	100195北京市海淀区闵庄路3号清华科技园玉泉慧谷11栋
法律状态	-

摘要

本发明为一种语种识别方法及系统，包括S0：建立背景噪音库和人声数据库；S100：基于背景噪音库对人声数据库中语音数据进行预处理；S200：对预处理后的语音数据进行VAD检测，提取活动语音数据的MFCC特征向量，建立人声GMM模型；S300：对背景噪音库中噪音数据进行VAD检测，提取所述活动噪音数据的MFCC特征向量，建立噪音GMM模型；S400：基于活动语音数据MFCC特征向量，建立GMM‑ivector语种识别模型，并生成语种特征库；S500：对待测声音数据进行VAD检测并提取MFCC特征向量，基于人声GMM模型和噪音GMM模型判断待测声音数据是否为人声信号；S600：若判断待测声音数据为人声信号，则用所述GMM‑ivector语种识别模型提取该待测声音数据的ivector特征，进行语种识别。本发明可稳定识别语种，增强鲁棒性。