多模态语音唤醒方法、装置及计算机可读存储介质专利查询专利号|摘要-满商公司网

多模态语音唤醒方法、装置及计算机可读存储介质

基本信息

摘要

摘要	本发明公开了一种多模态语音唤醒方法、装置及计算机可读存储介质，所述多模态语音唤醒方法包括以下步骤：获取用户的脸部图像特征，获取来自用户的语音信息；基于所述脸部图像特征或语音信息，判断所述用户是否有语音交互意图；若所述脸部图像特征和语音信息中的任一项满足预设交互条件，则判定所述用户有语音交互意图，并唤醒预设语音助手。通过实施本发明，能够识别用户的脸部图像特征，结合用户发出的语音信息，在收音环境嘈杂的情况下也能判断出用户是否有交互意图，从而可以选择是否唤醒语音助手，在人机交互的过程中减少了外界环境的干扰，增强了人机交互的体验，保证了语音交互时的高唤醒率。