一种视频字幕时间对齐模型训练方法及系统

基本信息

申请号 CN202111470819.0 申请日 -
公开(公告)号 CN114222193A 公开(公告)日 2022-03-22
申请公布号 CN114222193A 申请公布日 2022-03-22
分类号 H04N21/488(2011.01)I;H04N21/435(2011.01)I;G06V30/148(2022.01)I;G06V30/19(2022.01)I 分类 电通信技术;
发明人 程梓益 申请(专利权)人 北京影谱科技股份有限公司
代理机构 北京知呱呱知识产权代理有限公司 代理人 郑兴旺
地址 100125北京市朝阳区朝阳公园南路3号楼6层601内702室
法律状态 -

摘要

摘要 本申请公开了一种视频字幕时间对齐模型训练方法及系统,该方法首先获取带字幕的原始视频集以及描述文本集;将原始视频集与对应的描述文本集依次通过公共子串算法进行匹配,确定出描述文本集中各个段落所对应的OCR识别结果;根据每段文本以及该段文本对应的OCR识别结果形成数据集,并对数据集进行标注得到训练集;构建基于文本语义相似度匹配的视频字幕时间对齐模型,利用训练集对视频字幕时间对齐模型进行训练,得到训练完成的视频字幕时间对齐模型。可以看出,本申请实施例提供的视频字幕时间对齐模型解决了由于错别字,生僻字以及视频背景干扰的存在而产生的视频字幕时间匹配问题,相比于现有公共子串算法能够更加准确。