一种端到端多唤醒词的识别系统
基本信息
申请号 | CN202011500211.3 | 申请日 | - |
公开(公告)号 | CN112669830A | 公开(公告)日 | 2021-04-16 |
申请公布号 | CN112669830A | 申请公布日 | 2021-04-16 |
分类号 | G10L15/16;G10L15/20;G10L15/187;G10L15/02;G10L15/22;G10L25/30;G10L25/87 | 分类 | 乐器;声学; |
发明人 | 王建兵;厉伟成 | 申请(专利权)人 | 上海容大数字技术有限公司 |
代理机构 | 深圳至诚化育知识产权代理事务所(普通合伙) | 代理人 | 刘英 |
地址 | 201802 上海市嘉定区嘉好路700号2幢1294室 | ||
法律状态 | - |
摘要
摘要 | 本发明属于语音识别技术领域,尤其是一种端到端多唤醒词的识别系统,现提出以下方案,包括唤醒系统,所述唤醒系统包括有VAD检测模块、唤醒识别模块和唤醒确认模块,且唤醒系统的工作流程包括以下步骤:S1:首先进行音频采集,然后对采集的语音做VAD(VoiceActivityDetection语音活动检测)检测,即语音活动检测,可过滤掉大部分的静音和噪音音频;S2:其次对通过VAD检测的语音做唤醒识别,通过神经网络对输入的音频做判断,输出识别结果。本发明通过使用神经网络算法解决传统语音识别的问题,此技术及系统目的就是为了减少语音识别中不必要的音频采集,避免出现语音误识别,减少能量消耗,通过语音唤醒还可以让处于休眠中的设备进入工作状态。 |
