一种融合骨振动传感器和麦克风信号的深度学习语音提取和降噪方法
基本信息
申请号 | PCT/CN2019/110080 | 申请日 | - |
公开(公告)号 | WO2021068120A1 | 公开(公告)日 | 2021-04-15 |
申请公布号 | WO2021068120A1 | 申请公布日 | 2021-04-15 |
分类号 | G10L21/0208 | 分类 | 乐器;声学; |
发明人 | YAN, YONGJIE;闫永杰 | 申请(专利权)人 | 大象声科(深圳)科技有限公司 |
代理机构 | - | 代理人 | SHENZHEN KUAIMA PATENT & TRADEMARK OFFICE;深圳快马专利商标事务所(普通合伙) |
地址 | 533, Bld.12, Shenzhen Bay Science and Technology Ecological Park,No.18, Keji South Rd, High-Tech Zone, Yuehai Dist., Nanshan Dist.,Shenzhen, Guangdong 518000 CN | ||
法律状态 | - |
摘要
摘要 | 一种融合骨振动传感器和麦克风信号的深度学习降噪方法,包括如下步骤:S1骨振动传感器和麦克风采集音频信号,分别得到骨振动传感器音频信号和麦克风音频信号;S2将骨振动传感器音频信号输入高通滤波模块,并进行高通滤波;S3将经过高通滤波后的骨振动传感器音频信号或经过频带拓宽后的信号,与麦克风音频信号输入深度神经网络模块;S4深度神经网络模块经过预测得出融合降噪后的语音。该方法结合了骨震动传感器以及传统麦克风的信号,利用深度神经网络强大的建模能力实现了很高的人声还原度及极强的噪声抑制能力,可以解决复杂噪声场景下的人声提取问题,实现提取目标人声,降低干扰噪声,并可采用单麦克风结构减少成本。还可将骨振动传感器音频信号经过频带拓宽后的信号直接作为输出。 |
