一种基于实时人脸辅助的语音端点检测方法
基本信息
申请号 | CN202110346035.0 | 申请日 | - |
公开(公告)号 | CN113160853A | 公开(公告)日 | 2021-07-23 |
申请公布号 | CN113160853A | 申请公布日 | 2021-07-23 |
分类号 | G10L25/78;G10L15/05;G10L15/04;G10L15/02;G06K9/00 | 分类 | 乐器;声学; |
发明人 | 鱼海航 | 申请(专利权)人 | 深圳鱼亮科技有限公司 |
代理机构 | 合肥律众知识产权代理有限公司 | 代理人 | 殷娟 |
地址 | 518101 广东省深圳市宝安区西乡街道富华社区富瑰路富瑰园C栋1单元401 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于实时人脸辅助的语音端点检测方法,具体涉及语音识别技术领域,包括以下步骤:通过实时图像录取设备,获取用户面部的实时影像信息,并将影像信息传输至后台的控制中心,利用图像处理技术,对影像信息进行特征提取,获取影像信息中与用户面部相关的动作帧;提取用户面部特征,根据面部特征,确定数量不同的基准点,利用基准点构建用户的面部动作数据库,每个特定的面部动作由数个基准点组成,将上述获取的动作帧与面部动作数据库中的面部特征进行对比。本发明极大的降低了进行语音端点检测过程中的操作程序,也使进行处理的语音信息总量得到了减少,从而提升了语音端点检测的速率,提高了实用性。 |
