一种语音信号特征融合的方法

基本信息

申请号 CN201910556520.3 申请日 -
公开(公告)号 CN110322900A 公开(公告)日 2019-10-11
申请公布号 CN110322900A 申请公布日 2019-10-11
分类号 G10L25/63;G10L25/30;G10L25/03 分类 乐器;声学;
发明人 左靖东;况鹏;范振;詹佳丽;黎宁 申请(专利权)人 深圳市壹鸽科技有限公司
代理机构 深圳叁众知识产权代理事务所(普通合伙) 代理人 深圳市壹鸽科技有限公司
地址 518000 广东省深圳市南山区粤海街道高新区社区高新南七道011号高新工业村T3栋3AA
法律状态 -

摘要

摘要 本发明公开了一种新型的语音信号特征融合的方法,包括如下步骤:步骤1、模型框架搭建;步骤2、神经网络设计;步骤3、音频特征表示和提取。本发明把CNN变体和LSTM变体并行融合成一种新的混合神经网络,并结合Attention机制提取出对最终情感影响最大的信号特征,最终得到能更准确且快速分类情感的音频情感向量,泛化能力强,结构清晰,易于与其他模块集成与分离,而且克服了传统的语音信号特征不能有效融合的问题。