用于自语音中识别情感的方法与装置

基本信息

申请号 CN201711378503.2 申请日 -
公开(公告)号 CN108091323A 公开(公告)日 2018-05-29
申请公布号 CN108091323A 申请公布日 2018-05-29
分类号 G10L15/02;G10L15/04;G10L15/06;G10L25/24;G10L25/63 分类 乐器;声学;
发明人 C·C·多斯曼;B·N·利亚纳盖;T·J·M·厄斯特勒姆 申请(专利权)人 想象科技(北京)有限公司
代理机构 北京律盟知识产权代理有限责任公司 代理人 想象科技(北京)有限公司
地址 100025 北京市朝阳区建国路89号院4号楼805号
法律状态 -

摘要

摘要 本申请是关于自语音中识别情感的方法与装置。根据本申请一实施例的用于自语音中识别情感的方法可包括:接收音频信号、对所接收的音频信号进行数据清理、将所清理的音频信号分割成至少一段、对该至少一段执行特征提取以自该至少一段中提取若干梅尔频率倒谱系数和若干巴克频率倒谱系数、执行特征填充以基于长度门限将该若干梅尔频率倒谱系数和若干巴克频率倒谱系数填充至特征矩阵,以及对该特征矩阵执行机器学习推断以识别在该音频信号中所指示的情感。本申请实施例可适用于几乎任何尺寸的音频信号,且能实时识别整个语音的情感。