一种基于综合特征集的深度学习语音增强方法

基本信息

申请号 CN201810267142.2 申请日 -
公开(公告)号 CN108447495A 公开(公告)日 2020-06-09
申请公布号 CN108447495A 申请公布日 2020-06-09
分类号 G10L21/02;G10L21/0208;G10L25/24;G10L13/02 分类 乐器;声学;
发明人 张涛;任相赢;刘阳 申请(专利权)人 廊坊市华之邦科技服务有限公司
代理机构 天津市北洋有限责任专利代理事务所 代理人 杜文茹
地址 300072 天津市南开区卫津路92号
法律状态 -

摘要

摘要 一种基于综合特征集的深度学习语音增强方法:对音频PCM编码信号预处理:对音频PCM编码信号进行分帧、加窗,同时按照设定比例将原始数据集分为训练集和测试集;利用训练集对DBN的权重和偏置参数进行预训练和微调;利用训练好的DBN权重和偏置参数提取DBN声学特征;从训练集和测试集中提取互补特征集声学特征;从DBN声学特征和互补特征集的特征中选取所需特征;从五种特征汇总成的总向量中提取综合特征集声学特征;进行语音增强。本发明的综合特征集声学特征用于语音增强模型噪声抑制后,信噪比语音评价指标得到了较大提升,所以在极低信噪比条件下本发明表现出了非常好的优势。