一种基于综合特征集的深度学习语音增强方法
基本信息
申请号 | CN201810267142.2 | 申请日 | - |
公开(公告)号 | CN108447495A | 公开(公告)日 | 2020-06-09 |
申请公布号 | CN108447495A | 申请公布日 | 2020-06-09 |
分类号 | G10L21/02;G10L21/0208;G10L25/24;G10L13/02 | 分类 | 乐器;声学; |
发明人 | 张涛;任相赢;刘阳 | 申请(专利权)人 | 廊坊市华之邦科技服务有限公司 |
代理机构 | 天津市北洋有限责任专利代理事务所 | 代理人 | 杜文茹 |
地址 | 300072 天津市南开区卫津路92号 | ||
法律状态 | - |
摘要
摘要 | 一种基于综合特征集的深度学习语音增强方法:对音频PCM编码信号预处理:对音频PCM编码信号进行分帧、加窗,同时按照设定比例将原始数据集分为训练集和测试集;利用训练集对DBN的权重和偏置参数进行预训练和微调;利用训练好的DBN权重和偏置参数提取DBN声学特征;从训练集和测试集中提取互补特征集声学特征;从DBN声学特征和互补特征集的特征中选取所需特征;从五种特征汇总成的总向量中提取综合特征集声学特征;进行语音增强。本发明的综合特征集声学特征用于语音增强模型噪声抑制后,信噪比语音评价指标得到了较大提升,所以在极低信噪比条件下本发明表现出了非常好的优势。 |
