多特征融合识别婴儿哭声类别的方法、装置及设备

基本信息

申请号 CN202110218120.9 申请日 -
公开(公告)号 CN113035241A 公开(公告)日 2021-06-25
申请公布号 CN113035241A 申请公布日 2021-06-25
分类号 G10L25/63;G10L25/03;G10L25/18;G10L25/24;G10L25/30;G10L25/45;G10L25/57;G10L17/02;G06K9/62;G06N3/04;G06N3/08 分类 乐器;声学;
发明人 陈辉;张智;谢鹏;雷奇文;艾伟;胡国湖 申请(专利权)人 武汉星巡智能科技有限公司
代理机构 成都恪睿信专利代理事务所(普通合伙) 代理人 陈兴强
地址 430000 湖北省武汉市洪山区洪山街马湖村武汉创意天地三、四期4号楼9层4号
法律状态 -

摘要

摘要 本发明属于语音识别技术领域,解决了通过语音识别判断婴儿哭声,存在准确性低的技术问题,提供了一种多特征融合识别婴儿哭声类别的方法、装置及设备。该方法包括:获取婴儿啼哭时的音频特征、姿态动作的动作特征值和声带振动的振动频谱;将动作特征值转化为数据库中的标准特征值;基于标准特征值,对音频特征和振动频谱进行特征融合;将融合后的融合特征输入预置的神经网络,根据神经网络输出的编码特征向量得到婴儿的哭声类别;其中,标准特征值为对应的姿态动作所表征的各哭声类别的概率值。本发明还包括用于执行上述方法的装置及设备。本发明利用姿态特征来强化婴儿的需求,可以减低错误判断,提高哭声检测准确性。