一种基于噪声场景识别的活动语音检测方法及系统
基本信息
申请号 | CN202010783583.5 | 申请日 | - |
公开(公告)号 | CN111933175A | 公开(公告)日 | 2020-11-13 |
申请公布号 | CN111933175A | 申请公布日 | 2020-11-13 |
分类号 | G10L25/03(2013.01)I | 分类 | 乐器;声学; |
发明人 | 田野 | 申请(专利权)人 | 北京中电慧声科技有限公司 |
代理机构 | 北京天盾知识产权代理有限公司 | 代理人 | 张彩珍 |
地址 | 100015北京市朝阳区酒仙桥北路乙7号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于噪声场景识别的活动语音检测方法,从音频信号中提取面向噪声分类任务的优选特征,将特征值输入噪声类型分类器以识别音频信号中的噪声类型;根据噪声类型,确定适用于面向语音与噪声分类任务的优选特征和分类器;从音频信号中提取面向语音与噪声分类任务的优选特征,并将优选特征值输入语音噪声分类器,判断音频信号中是否存在语音信号;本发明还公开了基于噪声场景识别的活动语音检测系统。本发明公开的方法在进行含噪语音和噪音信号二分类前,对当前的噪声类型进行检测识别,针对具体噪声类型优选出最具有区分性的特征组合,可以针对具体噪声类型设计模型参数,保证了整个检测过程在不同噪声类型下性能的有效性和稳定性。 |
