基于多媒体语义解析的监控视频智能预警方法
基本信息
申请号 | CN202110447507.1 | 申请日 | - |
公开(公告)号 | CN113111837A | 公开(公告)日 | 2021-07-13 |
申请公布号 | CN113111837A | 申请公布日 | 2021-07-13 |
分类号 | G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 胡宇鹏;贾永坡;高赞;宋雪萌;尹建华;李毅仁;聂礼强 | 申请(专利权)人 | 河钢集团有限公司 |
代理机构 | 济南泉城专利商标事务所 | 代理人 | 支文彬 |
地址 | 250013山东省济南市历下区科院路19号 | ||
法律状态 | - |
摘要
摘要 | 一种基于多媒体语义解析的监控视频智能预警方法,通过建立跨模态语义对齐模型对视频中所包含的复杂对象与交互进行准确理解,并生成视频片段时空位置图和视频语义树,另一方面,引入基于双向长短时记忆网络的文本编码模块,对查询语句中的文本语义进行深刻理解与表征。实现多模态特征向共空间的特征映射与融合,并利用语义剪枝策略,粗粒度筛选出精炼的“视频片段‑查询语句”对,进行细粒度语义匹配计算,从而确保跨模态视频定位的精度与效率。 |
