一种视频流的同声传译系统及其实现方法
基本信息
申请号 | CN202111001773.8 | 申请日 | - |
公开(公告)号 | CN113721704A | 公开(公告)日 | 2021-11-30 |
申请公布号 | CN113721704A | 申请公布日 | 2021-11-30 |
分类号 | G06F1/12(2006.01)I;G06F16/74(2019.01)I;G06F16/783(2019.01)I;G06F40/58(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 杨丰羽;刘盾;唐学怡;杨皓 | 申请(专利权)人 | 成都华栖云科技有限公司 |
代理机构 | 成都立新致创知识产权代理事务所(特殊普通合伙) | 代理人 | 刘俊 |
地址 | 610000四川省成都市中国(四川)自由贸易试验区成都高新区天府五街200号4号楼A区9楼 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种视频流的同声传译系统及其实现方法,它包括解封装器组件用于将输入的视频流解封装,拆分成包含一系列按照时间顺序排列的视频帧组成的纯视频流和一系列按照时间顺序排列的音频帧组成的纯音频流;音频处理组件用于将输入的A种语言的音频帧进行解码、翻译、语速调节和编码;音视频缓存器组件用于分别缓存视频帧和音频帧,并实时反馈音视频帧时长给音频处理组件;时钟驱动封装器组件用于从音视频缓存器组件中取出要求时间长度的音视频进行封装并输出。本发明通过判断缓存的视频帧时长、音频帧时长以及音频翻译器翻译延迟时长三者之间的计算结果,来对音频翻译器中的语速参数进行调节,使得最后输出的视频流数据的音视频保持同步。 |
