一种语音端点检测模型的训练方法及语音降噪方法

基本信息

申请号 CN202110952262.8 申请日 -
公开(公告)号 CN113744725A 公开(公告)日 2021-12-03
申请公布号 CN113744725A 申请公布日 2021-12-03
分类号 G10L15/05(2013.01)I;G10L15/06(2013.01)I;G10L15/16(2006.01)I;G10L15/20(2006.01)I;G10L21/0208(2013.01)I;G10L21/0232(2013.01)I;G10L25/30(2013.01)I;G10L25/24(2013.01)I 分类 乐器;声学;
发明人 姜彦吉;张胜;赵雨萌;彭博;范佳亮 申请(专利权)人 华研慧声(苏州)电子科技有限公司
代理机构 苏州创元专利商标事务所有限公司 代理人 乔峰
地址 215134江苏省苏州市相城区高铁新城太阳路2266号5幢
法律状态 -

摘要

摘要 本发明公开了一种语音端点检测模型的训练方法及语音降噪方法,训练方法包括以下步骤:对纯净语音信号进行预处理和端点检测,以得到语音帧和静音帧的真实标签值;加入噪声信号,得到带噪语音信号;提取带噪语音信号的特征值;隐层依据特征值对带噪语音信号进行分类,以得到语音帧和纯噪声帧的估计标签值;对估计标签值与真实标签值进行损失函数计算,根据计算结果以优化语音端点检测模型的模型参数。本发明提供的语音端点检测模型的训练方法及语音降噪方法融合了深度学习思想,构建循环神经网络模型,基于数据驱动,计算算法中需要的估计参数值,得到更准确的噪声统计分布规律,进而达到较为理想的降噪效果。