基于语音类似度的混音方法

基本信息

申请号 CN201510052414.3 申请日 -
公开(公告)号 CN104616665B 公开(公告)日 2018-04-24
申请公布号 CN104616665B 申请公布日 2018-04-24
分类号 G10L25/48;G10L19/00;H04M3/56 分类 乐器;声学;
发明人 付姝华 申请(专利权)人 深圳市云之讯网络技术有限公司
代理机构 广州市越秀区哲力专利商标事务所(普通合伙) 代理人 深圳市云之讯网络技术有限公司
地址 518000 广东省深圳市南山区高新南四道8号创维半导体设计大厦东座18楼1802室
法律状态 -

摘要

摘要 本发明涉及基于语音类似度的混音方法,其对客户端输入的音频信号进行归一化处置,将音频信号分帧并进行时频变换,设置语音通道的目标电平,计算语音通道当前的电平大小,计算各语音通道的语音类似度,通过语音类似度和目标电平计算各语音通道的电平值,并根据各语音通道的电平值大小计算电平增益,得到电平提升后的音频频域数据,对音频频域数据进行叠加混音,最后用傅里叶反变换将音频频域数据转换为时域数据。语音类似度越大,对应的语音通道的电平值越大,如此可以保证混音中语音类似度越大的语音通道的音量就越大。