基于语音类似度的混音方法
基本信息
申请号 | CN201510052414.3 | 申请日 | - |
公开(公告)号 | CN104616665B | 公开(公告)日 | 2018-04-24 |
申请公布号 | CN104616665B | 申请公布日 | 2018-04-24 |
分类号 | G10L25/48;G10L19/00;H04M3/56 | 分类 | 乐器;声学; |
发明人 | 付姝华 | 申请(专利权)人 | 深圳市云之讯网络技术有限公司 |
代理机构 | 广州市越秀区哲力专利商标事务所(普通合伙) | 代理人 | 深圳市云之讯网络技术有限公司 |
地址 | 518000 广东省深圳市南山区高新南四道8号创维半导体设计大厦东座18楼1802室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及基于语音类似度的混音方法,其对客户端输入的音频信号进行归一化处置,将音频信号分帧并进行时频变换,设置语音通道的目标电平,计算语音通道当前的电平大小,计算各语音通道的语音类似度,通过语音类似度和目标电平计算各语音通道的电平值,并根据各语音通道的电平值大小计算电平增益,得到电平提升后的音频频域数据,对音频频域数据进行叠加混音,最后用傅里叶反变换将音频频域数据转换为时域数据。语音类似度越大,对应的语音通道的电平值越大,如此可以保证混音中语音类似度越大的语音通道的音量就越大。 |
