一种基于深度学习的语音情绪识别方案
基本信息
申请号 | CN202010089880.X | 申请日 | - |
公开(公告)号 | CN111292724A | 公开(公告)日 | 2020-06-16 |
申请公布号 | CN111292724A | 申请公布日 | 2020-06-16 |
分类号 | G10L15/06(2013.01)I | 分类 | - |
发明人 | 封吉宁 | 申请(专利权)人 | 上海凯岸信息科技有限公司 |
代理机构 | 上海海贝律师事务所 | 代理人 | 上海凯岸信息科技有限公司 |
地址 | 201808上海市嘉定区嘉罗公路1661弄12号101室-16 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于深度学习的语音情绪识别方案,包括如下步骤:步骤一,将训练用语音音频文件进行傅里叶变换转换到频域,然后再利用梅尔频率刻度的滤波器组对对应频域信号进行处理得到,就可以得到梅尔谱图,步骤二,语音情绪分类模型进行建立:将步骤一中的梅尔谱图经过CNN和LSTM的计算后,自动生成对于语音情绪分类重要的组合特征变量。本发明,第一点是使用深度学习方法替代传统机器学习方法,省去了耗时耗力的手工进行特征工程的步骤,使得整个模型训练过程更加清晰简洁。 |
