用于在人机对话中识别用户情绪的方法及装置
基本信息
申请号 | CN202210215326.0 | 申请日 | - |
公开(公告)号 | CN114582373A | 公开(公告)日 | 2022-06-03 |
申请公布号 | CN114582373A | 申请公布日 | 2022-06-03 |
分类号 | G10L25/63;G10L15/22;G10L15/26;G10L15/02;G06V40/16 | 分类 | 乐器;声学; |
发明人 | 徐涛 | 申请(专利权)人 | 浙江连信科技有限公司 |
代理机构 | 北京慧加伦知识产权代理有限公司 | 代理人 | 李永敏 |
地址 | 310051 浙江省杭州市滨江区长河街道越达巷79号1幢516室 | ||
法律状态 | - |
摘要
摘要 | 本公开的实施例提供一种用于在人机对话中识别用户情绪的方法和装置。该方法包括:获取第一语音数据,其中,第一语音数据为用户在本轮的语音数据;从第一语音数据中提取表征情绪的第一音频特征和表征情绪的第一文本特征;获取第二文本特征和第二音频特征中的至少一个,其中,第二文本特征为用户在前N轮中的各轮中的文本特征的加权和,第二音频特征为用户在前N轮中的各轮中的音频特征的加权和,其中,N为正整数;将第一音频特征、第一文本特征、以及第二文本特征和第二音频特征中的至少一个拼接成拼接特征;以及通过经训练的多模态模型基于拼接特征来识别用户在本轮的第一情绪。 |
