一种基于视频语音的人物识别方法、装置、设备和介质

基本信息

申请号 CN201810798832.0 申请日 -
公开(公告)号 CN108882033A 公开(公告)日 2018-11-23
申请公布号 CN108882033A 申请公布日 2018-11-23
分类号 H04N21/4415;H04N21/439;G06K9/00;G06F17/27 分类 电通信技术;
发明人 宋旭博 申请(专利权)人 上海影谱科技有限公司
代理机构 北京万思博知识产权代理有限公司 代理人 北京影谱科技股份有限公司;上海影谱科技有限公司
地址 100000 北京市朝阳区朝外大街22号5层521室
法律状态 -

摘要

摘要 本申请公开了一种基于视频语音的人物识别方法、装置、设备和介质。该方法包括:识别视频中出现的人物的面部图像,基于所述面部图像确定该人物的身份信息,得到第一身份信息集合,其中,所述第一身份集合至少包括一个身份信息;基于对与所述视频对应的音频进行检测得到的人物姓名列表,对所述第一身份信息集合进行过滤,得到第二身份信息集合。通过该方法,能够将人物头像识别和音频信息相结合,利用语音识别出的人名信息辅助识别人物身份,从而能够区分长相接近的演员,在远景镜头人物头像模糊的情况下,能够提高识别的准确性,减少无法识别和错误识别的情况。