一种基于视频语音的人物识别方法、装置、设备和介质
基本信息
申请号 | CN201810798832.0 | 申请日 | - |
公开(公告)号 | CN108882033A | 公开(公告)日 | 2018-11-23 |
申请公布号 | CN108882033A | 申请公布日 | 2018-11-23 |
分类号 | H04N21/4415;H04N21/439;G06K9/00;G06F17/27 | 分类 | 电通信技术; |
发明人 | 宋旭博 | 申请(专利权)人 | 上海影谱科技有限公司 |
代理机构 | 北京万思博知识产权代理有限公司 | 代理人 | 北京影谱科技股份有限公司;上海影谱科技有限公司 |
地址 | 100000 北京市朝阳区朝外大街22号5层521室 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种基于视频语音的人物识别方法、装置、设备和介质。该方法包括:识别视频中出现的人物的面部图像,基于所述面部图像确定该人物的身份信息,得到第一身份信息集合,其中,所述第一身份集合至少包括一个身份信息;基于对与所述视频对应的音频进行检测得到的人物姓名列表,对所述第一身份信息集合进行过滤,得到第二身份信息集合。通过该方法,能够将人物头像识别和音频信息相结合,利用语音识别出的人名信息辅助识别人物身份,从而能够区分长相接近的演员,在远景镜头人物头像模糊的情况下,能够提高识别的准确性,减少无法识别和错误识别的情况。 |
