一种语种识别方法及系统
基本信息
申请号 | CN202011338189.7 | 申请日 | - |
公开(公告)号 | CN112530407B | 公开(公告)日 | 2021-07-23 |
申请公布号 | CN112530407B | 申请公布日 | 2021-07-23 |
分类号 | G10L15/00(2013.01)I;G10L25/03(2013.01)I;G10L25/24(2013.01)I;G10L25/78(2013.01)I;G10L15/20(2006.01)I | 分类 | 乐器;声学; |
发明人 | 马杰 | 申请(专利权)人 | 北京快鱼电子股份公司 |
代理机构 | 北京天盾知识产权代理有限公司 | 代理人 | 张彩珍 |
地址 | 100195北京市海淀区闵庄路3号清华科技园玉泉慧谷11栋 | ||
法律状态 | - |
摘要
摘要 | 本发明为一种语种识别方法及系统,包括S0:建立背景噪音库和人声数据库;S100:基于背景噪音库对人声数据库中语音数据进行预处理;S200:对预处理后的语音数据进行VAD检测,提取活动语音数据的MFCC特征向量,建立人声GMM模型;S300:对背景噪音库中噪音数据进行VAD检测,提取所述活动噪音数据的MFCC特征向量,建立噪音GMM模型;S400:基于活动语音数据MFCC特征向量,建立GMM‑ivector语种识别模型,并生成语种特征库;S500:对待测声音数据进行VAD检测并提取MFCC特征向量,基于人声GMM模型和噪音GMM模型判断待测声音数据是否为人声信号;S600:若判断待测声音数据为人声信号,则用所述GMM‑ivector语种识别模型提取该待测声音数据的ivector特征,进行语种识别。本发明可稳定识别语种,增强鲁棒性。 |
