一种语音信号特征融合的方法
基本信息
申请号 | CN201910556520.3 | 申请日 | - |
公开(公告)号 | CN110322900A | 公开(公告)日 | 2019-10-11 |
申请公布号 | CN110322900A | 申请公布日 | 2019-10-11 |
分类号 | G10L25/63;G10L25/30;G10L25/03 | 分类 | 乐器;声学; |
发明人 | 左靖东;况鹏;范振;詹佳丽;黎宁 | 申请(专利权)人 | 深圳市壹鸽科技有限公司 |
代理机构 | 深圳叁众知识产权代理事务所(普通合伙) | 代理人 | 深圳市壹鸽科技有限公司 |
地址 | 518000 广东省深圳市南山区粤海街道高新区社区高新南七道011号高新工业村T3栋3AA | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种新型的语音信号特征融合的方法,包括如下步骤:步骤1、模型框架搭建;步骤2、神经网络设计;步骤3、音频特征表示和提取。本发明把CNN变体和LSTM变体并行融合成一种新的混合神经网络,并结合Attention机制提取出对最终情感影响最大的信号特征,最终得到能更准确且快速分类情感的音频情感向量,泛化能力强,结构清晰,易于与其他模块集成与分离,而且克服了传统的语音信号特征不能有效融合的问题。 |
