一种对话场景语音情绪识别方法、装置及计算设备
基本信息
申请号 | CN202010984306.0 | 申请日 | - |
公开(公告)号 | CN114203202A | 公开(公告)日 | 2022-03-18 |
申请公布号 | CN114203202A | 申请公布日 | 2022-03-18 |
分类号 | G10L25/63(2013.01)I;G10L25/30(2013.01)I | 分类 | 乐器;声学; |
发明人 | 孟庆林;吴海英;蒋宁;王洪斌;赵立军 | 申请(专利权)人 | 北京有限元科技有限公司 |
代理机构 | 北京万思博知识产权代理有限公司 | 代理人 | 范晓斌 |
地址 | 100080北京市海淀区王庄路1号B座23层27-整层2702 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种对话场景语音情绪识别方法、装置及计算设备。所述方法包括:提取训练样本的MFCC特征、一阶差分特征和二阶差分特征;读取待训练特征文件,形成数据‑标签的特征数据组合;将特征数据组合馈入改进的AlexNet网络及双向BiGRU网络,并通过CTC进行特征序列对齐,将CTC的输出送入Softmax分类器,再根据交叉熵损失进行反向传播训练,得到识别模型;使用所述模型对客服与客户声道录音进行情绪分类。所述装置包括训练特征提取模块、数据标签模块、训练模块和识别模块。所述计算设备包括存储器、处理器和存储在存储器内并能由处理器运行的计算机程序,所述处理器执行所述计算机程序时实现本申请所述的方法。 |
