混音方法、装置、设备及存储介质
基本信息
申请号 | CN201710665368.3 | 申请日 | - |
公开(公告)号 | CN109389989B | 公开(公告)日 | 2021-11-30 |
申请公布号 | CN109389989B | 申请公布日 | 2021-11-30 |
分类号 | G10L21/007(2013.01)I;G10L21/02(2013.01)I;G10L21/0272(2013.01)I;G10L21/0316(2013.01)I;G10L25/84(2013.01)I;G10L15/14(2006.01)I;G10L15/16(2006.01)I;G10L15/18(2013.01)I;H04S3/00(2006.01)I | 分类 | 乐器;声学; |
发明人 | 吴威麒;张凯磊 | 申请(专利权)人 | 上海谦问万答吧云计算科技有限公司 |
代理机构 | 北京品源专利代理有限公司 | 代理人 | 孟金喆 |
地址 | 215611 江苏省苏州市张家港市塘桥镇南京西路259号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种混音方法、装置、设备及存储介质。其中,一种混音方法,包括:接收至少两路声道的音频流数据;通过预先训练的人声检测模型检测所有声道的音频流数据的类型,以识别出人声声道音频流数据和噪声声道音频流数据;将人声声道音频流数据进行混音生成人声混音数据;将噪声声道音频流数据进行混音生成噪声混音数据;将人声混音数据与噪声混音数据进行混音生成结果混音数据。本发明实施例通过预先训练的人声检测模型区分人声声道音频流数据和噪声声道音频流数据,然后对二者分别进行混音,再将混音结果叠加生成结果混音数据,突出了结果混音数据中的人声音频流数据的幅值,使混音后的人声更加清晰,实用性和用户体验较好。 |
