一种基于实时人脸辅助的语音端点检测方法

基本信息

申请号 CN202110346035.0 申请日 -
公开(公告)号 CN113160853A 公开(公告)日 2021-07-23
申请公布号 CN113160853A 申请公布日 2021-07-23
分类号 G10L25/78;G10L15/05;G10L15/04;G10L15/02;G06K9/00 分类 乐器;声学;
发明人 鱼海航 申请(专利权)人 深圳鱼亮科技有限公司
代理机构 合肥律众知识产权代理有限公司 代理人 殷娟
地址 518101 广东省深圳市宝安区西乡街道富华社区富瑰路富瑰园C栋1单元401
法律状态 -

摘要

摘要 本发明公开了一种基于实时人脸辅助的语音端点检测方法,具体涉及语音识别技术领域,包括以下步骤:通过实时图像录取设备,获取用户面部的实时影像信息,并将影像信息传输至后台的控制中心,利用图像处理技术,对影像信息进行特征提取,获取影像信息中与用户面部相关的动作帧;提取用户面部特征,根据面部特征,确定数量不同的基准点,利用基准点构建用户的面部动作数据库,每个特定的面部动作由数个基准点组成,将上述获取的动作帧与面部动作数据库中的面部特征进行对比。本发明极大的降低了进行语音端点检测过程中的操作程序,也使进行处理的语音信息总量得到了减少,从而提升了语音端点检测的速率,提高了实用性。