多媒体流处理方法及装置
基本信息
申请号 | CN202111666523.6 | 申请日 | - |
公开(公告)号 | CN114005079A | 公开(公告)日 | 2022-02-01 |
申请公布号 | CN114005079A | 申请公布日 | 2022-02-01 |
分类号 | G06V20/40(2022.01)I;G06V40/20(2022.01)I;G06V40/16(2022.01)I;G06V30/10(2022.01)I;H04L65/60(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 赵悦汐;程红兵;鞠剑伟;昝晨辉 | 申请(专利权)人 | 北京金茂教育科技有限公司 |
代理机构 | 北京中索知识产权代理有限公司 | 代理人 | 葛靖 |
地址 | 100000北京市丰台区汽车博物馆东路8号院3号楼15层1503 | ||
法律状态 | - |
摘要
摘要 | 本申请提供一种多媒体流处理方法及装置。其中,所述方法包括:获取多媒体流片段;解码获取视频流子片段和音频流子片段;分析所述视频流子片段生成场景信息、第一文本信息;分析所述音频流子片段生成第二文本信息;处理所述场景信息、所述第一文本信息和所述第二文本信息,形成所述多媒体流的分析摘要。通过将多媒体流文件进行拆解,能够通过有效结合各种独立的AI模块进行复杂场景下多媒体文件内容识别,有效提升了复杂场景下现有独立的AI技术识别效率。 |
