一种基于前馈记忆网络的多通道防串音动态规划策略
基本信息
申请号 | CN202111654488.6 | 申请日 | - |
公开(公告)号 | CN114566150A | 公开(公告)日 | 2022-05-31 |
申请公布号 | CN114566150A | 申请公布日 | 2022-05-31 |
分类号 | G10L15/02(2006.01)I;G10L15/16(2006.01)I;G10L15/20(2006.01)I;G10L15/22(2006.01)I;G10L15/26(2006.01)I;G10L15/28(2013.01)I;G10L21/0208(2013.01)I;H04R1/08(2006.01)I;H04R3/04(2006.01)I | 分类 | 乐器;声学; |
发明人 | 麦联韬;唐海江;朱宇;袁宇豪 | 申请(专利权)人 | 杭州云嘉云计算有限公司 |
代理机构 | 杭州杭诚专利事务所有限公司 | 代理人 | - |
地址 | 311100浙江省杭州市余杭区五常街道联创街188号5号楼401室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于前馈记忆网络的多通道防串音动态规划策略,具体包括以下步骤:步骤S1:采集音源信息;步骤S2:自适应音源增益;步骤S3:串音过滤过程;步骤S4:输出处理后的声音,获得多通道识别结果;本发明提供的自适应音源增益过程不受限于具体现场环境结构、硬件采音设备和发言人的行为,能实时动态地对发言人的声学信号进行有助于提升识别效果的音源增益,从而避免传统方法的调优成本,保障实录过程;通过有效的声学特征提取和串音辨识策略模型,实时识别和过滤串音通道,显著降低了串音现象的发生;对较为极端的现场环境,本发明提供的调整参数简单易用,能快速及时地作出针对性调整,提升实录效果。 |
