多模态情感识别方法、装置、设备及存储介质

基本信息

申请号 CN202010727888.4 申请日 -
公开(公告)号 CN111898670A 公开(公告)日 2020-11-06
申请公布号 CN111898670A 申请公布日 2020-11-06
分类号 G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 刘鹏飞;李坤;蒙美玲 申请(专利权)人 深圳市声希科技有限公司
代理机构 深圳市恒程创新知识产权代理有限公司 代理人 深圳市声希科技有限公司
地址 518000广东省深圳市新安街道兴东社区留仙大道2号汇聚创新园2栋2710
法律状态 -

摘要

摘要 本发明属于情感识别技术领域,公开了一种多模态情感识别方法、装置、设备及存储介质。该方法包括:获取待识别语音音频的语音特征和文本特征;对所述语音特征和所述文本特征进行相关性对齐,获得与所述文本特征对齐的目标语音信息和与所述语音特征对齐的目标文本信息;对所述目标语音信息与所述目标文本信息进行融合,获得目标待识别信息;根据所述目标待识别信息进行情感识别,得到情感识别结果。通过上述方式,对语音特征和文本特征进行了相关性对齐,得到更具识别性的双向对齐特征,并对双向对齐的特征信息进行了融合,为情感识别提供了更具有区分性的待识别信息,提高情感识别结果的准确性。