一种字幕生成方法和装置专利查询专利号|摘要-满商公司网

一种字幕生成方法和装置

基本信息

摘要

摘要	本申请提供了一种字幕生成方法和装置，其中，方法包括：检测目标视频中所包含人物的状态和/或目标视频的音频波形幅值，根据目标视频中所包含人物的状态和/或目标视频的音频波形幅值，判断目标视频中是否有在说话的目标人物，若判定目标视频中有在说话的目标人物，则开始获取目标视频的语音识别结果，直至根据目标人物的状态和/或目标视频的音频波形幅值判定目标人物不再说话，最后根据获取的语音识别结果生成目标人物对应的字幕信息。本申请能够基于目标视频中所包含人物的状态和/或目标视频的音频波形幅值，生成目标视频所包含的各个人物分别对应的字幕信息，生成的字幕信息效果更好。