一种辅助语音交互的方法及系统、存储介质

基本信息

申请号 CN202110587518.X 申请日 -
公开(公告)号 CN113380243A 公开(公告)日 2021-09-10
申请公布号 CN113380243A 申请公布日 2021-09-10
分类号 G10L15/22(2006.01)I;G06K9/00(2006.01)I 分类 乐器;声学;
发明人 韩小平;曾庆宁;胡建良;熊清海;李志超 申请(专利权)人 广州广电运通金融电子股份有限公司
代理机构 杭州创智卓英知识产权代理事务所(普通合伙) 代理人 张超
地址 510000广东省广州市高新技术产业开发区科学城科林路9、11号
法律状态 -

摘要

摘要 本发明公开了一种辅助语音交互的方法及系统、存储介质,所述方法包括以下步骤:在用户与设备进行语音交互时,通过人脸检测模块对设定区域进行人脸检测;在设定区域内检测到人脸时,开启语音拾音操作,获取语音数据;对获取到的语音数据进行语音识别;所述在设定区域内检测到人脸时,开启语音拾音操作包括:在检测到多个人脸时,获取距离设备最近的人脸,采集距离设备最近的人脸对应的语音数据;在检测到单个人脸时,采集所述单个人脸对应的语音数据。本发明通过视频辅助语音交互,避免了轨道交通场景中人员多导致的干扰语音多的问题,同时避免了在语音交互时,多个人出现在设备前导致的语音干扰问题。