一种基于噪声场景识别的活动语音检测方法及系统

基本信息

申请号 CN202010783583.5 申请日 -
公开(公告)号 CN111933175A 公开(公告)日 2020-11-13
申请公布号 CN111933175A 申请公布日 2020-11-13
分类号 G10L25/03(2013.01)I 分类 乐器;声学;
发明人 田野 申请(专利权)人 北京中电慧声科技有限公司
代理机构 北京天盾知识产权代理有限公司 代理人 张彩珍
地址 100015北京市朝阳区酒仙桥北路乙7号
法律状态 -

摘要

摘要 本发明公开了一种基于噪声场景识别的活动语音检测方法,从音频信号中提取面向噪声分类任务的优选特征,将特征值输入噪声类型分类器以识别音频信号中的噪声类型;根据噪声类型,确定适用于面向语音与噪声分类任务的优选特征和分类器;从音频信号中提取面向语音与噪声分类任务的优选特征,并将优选特征值输入语音噪声分类器,判断音频信号中是否存在语音信号;本发明还公开了基于噪声场景识别的活动语音检测系统。本发明公开的方法在进行含噪语音和噪音信号二分类前,对当前的噪声类型进行检测识别,针对具体噪声类型优选出最具有区分性的特征组合,可以针对具体噪声类型设计模型参数,保证了整个检测过程在不同噪声类型下性能的有效性和稳定性。