一种可语音识别的信息转化方法和装置
基本信息
申请号 | CN202011148047.4 | 申请日 | - |
公开(公告)号 | CN112562692A | 公开(公告)日 | 2021-03-26 |
申请公布号 | CN112562692A | 申请公布日 | 2021-03-26 |
分类号 | G10L25/57(2013.01)I;G10L15/08(2006.01)I;G10L17/02(2013.01)I;G10L15/25(2013.01)I;G10L17/14(2013.01)I;G10L17/04(2013.01)I | 分类 | 乐器;声学; |
发明人 | 汪正;仲昌燕;陈云;刘利祥;陈林 | 申请(专利权)人 | 安徽孺牛科技有限公司 |
代理机构 | 合肥正则元起专利代理事务所(普通合伙) | 代理人 | 王俊晓 |
地址 | 243000安徽省马鞍山市慈湖高新区霍里山大道北段1669号2栋 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种可语音识别的信息转化方法和装置,包括当采集到多个人员的语音数据时,将每个人员的语音数据的声纹与预先建立的语音声纹库中的声纹进行对比,获取对应用户的标准人脸图像数据,将实时人脸图像数据与标准人脸图像数据进行对比;检测实时视频中是否出现人脸面部表情;检测实时视频中人员的口型信息是否在采集到语音数据时同步发生变化,有效区分录音和现场语音数据;在将目标语音数据发送至语音识别模块之前,判断目标语音数据的有效性,避免用户在情绪不稳时发出的错误指令,提高体验度;且语音识别模块中语音识别的关键词拆分识别以及有效关键词汇总的方法,能够实现快速语音识别,使用稳定。 |
