一种视频字幕时间对齐方法、系统及存储介质

基本信息

申请号 CN202111470116.8 申请日 -
公开(公告)号 CN114143613A 公开(公告)日 2022-03-04
申请公布号 CN114143613A 申请公布日 2022-03-04
分类号 H04N21/488(2011.01)I;H04N21/845(2011.01)I;H04N21/8547(2011.01)I;G06V20/40(2022.01)I;G06V20/62(2022.01)I;G06V10/22(2022.01)I;G06V10/74(2022.01)I 分类 电通信技术;
发明人 程梓益 申请(专利权)人 北京影谱科技股份有限公司
代理机构 北京知呱呱知识产权代理有限公司 代理人 郑兴旺
地址 100125北京市朝阳区朝阳公园南路3号楼6层601内702室
法律状态 -

摘要

摘要 本申请公开了一种视频字幕时间对齐方法、系统及存储介质。该方法包括首先获取带字幕的原始视频以及描述文本,其中,描述文本的内容与原始视频中字幕的内容相对应;根据预设的取帧间隔时间截取原始视频中的字幕区域得到字幕区域图像集;将字幕区域图像集输入到OCR识别模型进行OCR识别得到带有时间戳的OCR识别结果;将OCR识别结果与描述文本每个段落通过公共子串算法进行匹配,确定出OCR识别结果在每个段落的首句和尾句;根据每个段落的首句和尾句分别对应的时间戳确定描述文本各个段落在原始视频中的持续时间。可以看出,本申请实施例提供的技术方案提高视频字幕与描述文本进行时间匹配的准确性。