一种混合音视频检索方法及系统

基本信息

申请号 CN201410668366.6 申请日 -
公开(公告)号 CN104391924A 公开(公告)日 2015-03-04
申请公布号 CN104391924A 申请公布日 2015-03-04
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 马展;田海 申请(专利权)人 南京讯思雅信息科技有限公司
代理机构 南京经纬专利商标代理有限公司 代理人 朱小兵
地址 211100 江苏省南京市江宁开发区将军大道37号翠屏科创园2号楼1226
法律状态 -

摘要

摘要 本发明公开了一种混合音视频检索方法及系统,方法包括:步骤(1)将任意视频数据分解成视频序列和音频序列;步骤(2)针对视频序列,通过场景分析提取有限场景帧;步骤(3)在有限场景帧上提取特征点组成表征该场景帧的特征矢量;步骤(4)针对音频序列,通过使用音频转文字的算法,将其转换成和音频时间轴匹配的文字串;步骤(5)根据音视频同步时间轴信息将步骤(3)所述场景帧的特征矢量和步骤(4)所述文字串匹配,作为元数据附加在原始视频数据头文件,开放给上层接口检索。本发明提出一种混合音视频检索系统。本发明通过综合视频特征提取,音频转文字,文字关键字自动传递,将海量视频数据检索效率和准确性大大提高。