一种端到端多唤醒词的识别系统

基本信息

申请号 CN202011500211.3 申请日 -
公开(公告)号 CN112669830A 公开(公告)日 2021-04-16
申请公布号 CN112669830A 申请公布日 2021-04-16
分类号 G10L15/16;G10L15/20;G10L15/187;G10L15/02;G10L15/22;G10L25/30;G10L25/87 分类 乐器;声学;
发明人 王建兵;厉伟成 申请(专利权)人 上海容大数字技术有限公司
代理机构 深圳至诚化育知识产权代理事务所(普通合伙) 代理人 刘英
地址 201802 上海市嘉定区嘉好路700号2幢1294室
法律状态 -

摘要

摘要 本发明属于语音识别技术领域,尤其是一种端到端多唤醒词的识别系统,现提出以下方案,包括唤醒系统,所述唤醒系统包括有VAD检测模块、唤醒识别模块和唤醒确认模块,且唤醒系统的工作流程包括以下步骤:S1:首先进行音频采集,然后对采集的语音做VAD(VoiceActivityDetection语音活动检测)检测,即语音活动检测,可过滤掉大部分的静音和噪音音频;S2:其次对通过VAD检测的语音做唤醒识别,通过神经网络对输入的音频做判断,输出识别结果。本发明通过使用神经网络算法解决传统语音识别的问题,此技术及系统目的就是为了减少语音识别中不必要的音频采集,避免出现语音误识别,减少能量消耗,通过语音唤醒还可以让处于休眠中的设备进入工作状态。