一种视频字幕的提取方法及系统

基本信息

申请号 CN202010356689.7 申请日 -
公开(公告)号 CN111539427A 公开(公告)日 2020-08-14
申请公布号 CN111539427A 申请公布日 2020-08-14
分类号 G06K9/32(2006.01)I;H04N21/488(2011.01)I 分类 -
发明人 李钦;王正航 申请(专利权)人 武汉译满天下科技有限公司
代理机构 武汉智权专利代理事务所(特殊普通合伙) 代理人 武汉译满天下科技有限公司
地址 430000湖北省武汉市东湖新技术开发区关山大道355号光谷新世界T+写字楼B栋2007
法律状态 -

摘要

摘要 本发明公开了一种视频字幕的提取方法及系统,涉及图像处理领域,该方法包括选取视频画面中的特定区域作为字幕识别区域,并对视频画面中字幕颜色进行选取;基于确定的字幕识别区域,对视频的每一帧画面进行裁剪,并基于图像识别算法,对每一帧画面的字幕识别区域进行识别,以判断每一帧画面的字幕识别区域是否含有字幕,以及判断前后相邻两帧画面的字幕识别区域是否相似;基于判断结果,将视频中含有相同字幕且相邻的帧归为一组,并记录每组中首尾帧的时间戳;对每组中首帧画面的字幕识别区域进行OCR,得到字幕,则当前组首尾帧的时间戳为当前得到字幕的开始时间戳和结束时间戳,并生成字幕文件。本发明能够有效节省视频字幕的提取时间。