基于掩码时域解码器的实时语音降噪方法和装置
基本信息
申请号 | CN202110299114.0 | 申请日 | - |
公开(公告)号 | CN113096682A | 公开(公告)日 | 2021-07-09 |
申请公布号 | CN113096682A | 申请公布日 | 2021-07-09 |
分类号 | G10L21/0224(2013.01)I;G10L25/30(2013.01)I | 分类 | 乐器;声学; |
发明人 | 李平平 | 申请(专利权)人 | 杭州知存智能科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 311121浙江省杭州市余杭区仓前街道良睦路1399号19幢102-9室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种基于掩码时域解码器的实时语音降噪方法和装置,该方法包括:将带噪语音通过Stft提取特征;将提取的特征输入预训练的神经网络得到掩码mask;将所述掩码以及所述带噪语音输入时域解码器进行解码得到增强后的语音,其中,通过将一组加权函数(掩码)应用于时域解码器来处理带噪语音实现基于时域后处理的实时神经网络降噪,具有显着较小的模型尺寸和更短的最小等待时间,使其成为边缘设备实时降噪的合适解决方案。 |
