一种用于直播流实时生成字幕的方法及系统

基本信息

申请号 CN202011072549.3 申请日 -
公开(公告)号 CN112188241A 公开(公告)日 2021-01-05
申请公布号 CN112188241A 申请公布日 2021-01-05
分类号 H04N21/235(2011.01)I 分类 电通信技术;
发明人 唐杰;王遥远;李庆瑜;戴立言 申请(专利权)人 上海网达软件股份有限公司
代理机构 上海汉声知识产权代理有限公司 代理人 上海网达软件股份有限公司
地址 201206上海市浦东新区中国(上海)自由贸易试验区川桥路409号
法律状态 -

摘要

摘要 本发明涉及音视频直播技术领域,提供了一种用于直播流实时生成字幕的方法及系统,其方法包括:对直播信源解码得到视频帧和音频帧;建立AI语音翻译引擎与转码引擎之间的通信;AI语音翻译引擎向转码引擎获取音频帧,并对音频帧实时翻译,输出翻译内容;转码引擎实时向AI语音翻译引擎获取翻译内容,通过将翻译内容使用通过包括将翻译内容烧入视频帧中、将翻译内容填充打包成字幕帧在内的任意一种方式与原始的视频帧与音频帧共同封装输出直播流。在直播时对音频流进行实时翻译生成字幕,实现真正的字幕与音视频同步,并同时输出多国语言的字幕,同时满足不同直播流推送协议的带字幕直播流,并且满足播放器自由选择不同语言的字幕显示。