一种有效语音识别方法及装置
基本信息
申请号 | CN201710573521.X | 申请日 | - |
公开(公告)号 | CN107369449B | 公开(公告)日 | 2019-11-26 |
申请公布号 | CN107369449B | 申请公布日 | 2019-11-26 |
分类号 | G10L15/26;G10L21/0208;G10L21/0272;G06K9/00 | 分类 | 乐器;声学; |
发明人 | 蒋化冰;蔡汉嘉;廖凯;齐鹏举;方园;米万珠;舒剑;吴琨;管伟;罗璇 | 申请(专利权)人 | 诺亚机器人科技(上海)有限公司 |
代理机构 | 上海硕力知识产权代理事务所(普通合伙) | 代理人 | 郭桂峰 |
地址 | 200335 上海市长宁区广顺路33号2幢402室 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例提供一种有效语音识别的方法及装置,所述方法包括:记录声源对象的语音数据,同时获取所述声源对象的脸部图像数据;对所述语音数据进行ASR识别,获得ASR识别结果,所述ASR识别结果包括若干条语音内容及对应的语音记录时间点;对所述声源对象的脸部图像数据进行张口特征识别,获得若干帧张口图像和所述每帧张口图像对应的图像获取时间点;以及,比对所述每条语音内容对应的语音记录时间点的前后预设时间范围内,是否有相应的张口图像的图像获取时间点在此范围内;若有,记录对应的语音内容为有效语音。通过本方法及装置,能够从ASR识别结果中识别有效的语音数据,有效提高ASR识别结果的应用价值。 |
