一种视频字幕时间对齐模型训练方法及系统
基本信息
申请号 | CN202111470819.0 | 申请日 | - |
公开(公告)号 | CN114222193A | 公开(公告)日 | 2022-03-22 |
申请公布号 | CN114222193A | 申请公布日 | 2022-03-22 |
分类号 | H04N21/488(2011.01)I;H04N21/435(2011.01)I;G06V30/148(2022.01)I;G06V30/19(2022.01)I | 分类 | 电通信技术; |
发明人 | 程梓益 | 申请(专利权)人 | 北京影谱科技股份有限公司 |
代理机构 | 北京知呱呱知识产权代理有限公司 | 代理人 | 郑兴旺 |
地址 | 100125北京市朝阳区朝阳公园南路3号楼6层601内702室 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种视频字幕时间对齐模型训练方法及系统,该方法首先获取带字幕的原始视频集以及描述文本集;将原始视频集与对应的描述文本集依次通过公共子串算法进行匹配,确定出描述文本集中各个段落所对应的OCR识别结果;根据每段文本以及该段文本对应的OCR识别结果形成数据集,并对数据集进行标注得到训练集;构建基于文本语义相似度匹配的视频字幕时间对齐模型,利用训练集对视频字幕时间对齐模型进行训练,得到训练完成的视频字幕时间对齐模型。可以看出,本申请实施例提供的视频字幕时间对齐模型解决了由于错别字,生僻字以及视频背景干扰的存在而产生的视频字幕时间匹配问题,相比于现有公共子串算法能够更加准确。 |
