一种阵列语音增强算法

基本信息

申请号 CN201811227423.1 申请日 -
公开(公告)号 CN109308904A 公开(公告)日 2019-02-05
申请公布号 CN109308904A 申请公布日 2019-02-05
分类号 G10L21/02;G10L15/22;G10L21/0216;G10L21/0224;G10L21/0232 分类 乐器;声学;
发明人 蔡洪滨;何昕;陈学超;顾樑 申请(专利权)人 上海声瀚信息科技有限公司
代理机构 上海海贝律师事务所 代理人 上海声瀚信息科技有限公司
地址 200433 上海市杨浦区国定路323号1102-72室
法律状态 -

摘要

摘要 本发明公开了一种阵列语音增强算法,包括额步骤有S10噪声估计:通过定义接收到的音频信号,利用对每个频带跟踪带噪语音功率的最小值来实现对该频带的噪声的粗略估计;S20时频掩蔽估计:通过定义某个时频点上语音出现的后验概率为当前时频点的掩蔽系数,用于估计噪声和语音在语谱图上存在的概率;S30阵列MVDR权系数向量估计:通过定义多路输入信号每帧的频域向量,用于估计目标声源的具体方位,本发明在最小畸变的条件下最大程度的提升有效语音,使经多路增强后的语音信号识别率得到明显提升,增强语音信号的信噪比,大大增强了语音的可懂度。