一种用于音视频人物的命名方法及相关装置

基本信息

申请号 CN202110604453.5 申请日 -
公开(公告)号 CN113362832A 公开(公告)日 2021-09-07
申请公布号 CN113362832A 申请公布日 2021-09-07
分类号 G10L17/08(2013.01)I;G10L15/26(2006.01)I;G10L15/25(2013.01)I;G06K9/00(2006.01)I 分类 乐器;声学;
发明人 徐波 申请(专利权)人 广东利为网络科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 刘晓娟
地址 510000广东省广州市萝岗区伴河路90号自编一栋305房
法律状态 -

摘要

摘要 本申请公开了一种用于音视频人物的命名方法及相关装置,方法包括:对获取的音视频进行分离处理,得到音频数据和视频数据;对音频数据进行人声语音检测,得到若干语音片段,并对视频数据依次进行人脸跟踪和人脸识别,得到若干携带有人脸身份信息的人脸视频片段;基于各语音片段的声纹特征对各语音片段添加初始人物名称,并将各语音片段的初始人物名称关联到对应的人脸视频片段;对各语音片段进行语音识别,得到语音文本信息,对人脸视频片段进行唇语识别,得到唇语文本信息;根据语音文本信息、唇语文本信息和人脸身份信息对人脸视频片段关联的初始人物名称进行修正,得到修正后人物名称,改善了现有的命名方法存在的准确性低的技术问题。