一种基于深度学习的语音情绪识别方案

基本信息

申请号 CN202010089880.X 申请日 -
公开(公告)号 CN111292724A 公开(公告)日 2020-06-16
申请公布号 CN111292724A 申请公布日 2020-06-16
分类号 G10L15/06(2013.01)I 分类 -
发明人 封吉宁 申请(专利权)人 上海凯岸信息科技有限公司
代理机构 上海海贝律师事务所 代理人 上海凯岸信息科技有限公司
地址 201808上海市嘉定区嘉罗公路1661弄12号101室-16
法律状态 -

摘要

摘要 本发明公开了一种基于深度学习的语音情绪识别方案,包括如下步骤:步骤一,将训练用语音音频文件进行傅里叶变换转换到频域,然后再利用梅尔频率刻度的滤波器组对对应频域信号进行处理得到,就可以得到梅尔谱图,步骤二,语音情绪分类模型进行建立:将步骤一中的梅尔谱图经过CNN和LSTM的计算后,自动生成对于语音情绪分类重要的组合特征变量。本发明,第一点是使用深度学习方法替代传统机器学习方法,省去了耗时耗力的手工进行特征工程的步骤,使得整个模型训练过程更加清晰简洁。