一种视频字幕时间对齐模型训练方法及系统专利查询专利号|摘要-满商公司网

一种视频字幕时间对齐模型训练方法及系统

基本信息

摘要

摘要	本申请公开了一种视频字幕时间对齐模型训练方法及系统，该方法首先获取带字幕的原始视频集以及描述文本集；将原始视频集与对应的描述文本集依次通过公共子串算法进行匹配，确定出描述文本集中各个段落所对应的OCR识别结果；根据每段文本以及该段文本对应的OCR识别结果形成数据集，并对数据集进行标注得到训练集；构建基于文本语义相似度匹配的视频字幕时间对齐模型，利用训练集对视频字幕时间对齐模型进行训练，得到训练完成的视频字幕时间对齐模型。可以看出，本申请实施例提供的视频字幕时间对齐模型解决了由于错别字，生僻字以及视频背景干扰的存在而产生的视频字幕时间匹配问题，相比于现有公共子串算法能够更加准确。