多媒体流处理方法及装置

基本信息

申请号 CN202111666523.6 申请日 -
公开(公告)号 CN114005079A 公开(公告)日 2022-02-01
申请公布号 CN114005079A 申请公布日 2022-02-01
分类号 G06V20/40(2022.01)I;G06V40/20(2022.01)I;G06V40/16(2022.01)I;G06V30/10(2022.01)I;H04L65/60(2022.01)I 分类 计算;推算;计数;
发明人 赵悦汐;程红兵;鞠剑伟;昝晨辉 申请(专利权)人 北京金茂教育科技有限公司
代理机构 北京中索知识产权代理有限公司 代理人 葛靖
地址 100000北京市丰台区汽车博物馆东路8号院3号楼15层1503
法律状态 -

摘要

摘要 本申请提供一种多媒体流处理方法及装置。其中,所述方法包括:获取多媒体流片段;解码获取视频流子片段和音频流子片段;分析所述视频流子片段生成场景信息、第一文本信息;分析所述音频流子片段生成第二文本信息;处理所述场景信息、所述第一文本信息和所述第二文本信息,形成所述多媒体流的分析摘要。通过将多媒体流文件进行拆解,能够通过有效结合各种独立的AI模块进行复杂场景下多媒体文件内容识别,有效提升了复杂场景下现有独立的AI技术识别效率。