一种违规图像识别方法、系统及设备

基本信息

申请号 CN202210115379.5 申请日 -
公开(公告)号 CN114140673A 公开(公告)日 2022-03-04
申请公布号 CN114140673A 申请公布日 2022-03-04
分类号 G06V10/80(2022.01)I;G06V30/148(2022.01)I;G06V10/774(2022.01)I;G06V10/764(2022.01)I;G06F40/289(2020.01)I 分类 计算;推算;计数;
发明人 阮晓峰;王坚;李兵;余昊楠;胡卫明 申请(专利权)人 人民中科(北京)智能技术有限公司
代理机构 北京三友知识产权代理有限公司 代理人 许曼;刘飞
地址 250101山东省济南市中国(山东)自由贸易试验区济南片区经十路7000号汉峪金谷新媒体大厦2层201室
法律状态 -

摘要

摘要 本文涉及人工智能领域,提供了一种违规图像识别方法、系统及设备,方法包括:分析待识别图像,得到文本信息及图像信息;将文本信息输入至文本特征提取模型中,得到文本特征向量组;将图像信息输入至图像特征提取模型中,得到图像特征向量组;将文本特征向量组及图像特征向量组输入至特征融合模型中,得到融合特征向量组,特征融合模型用于利用交叉注意力机制使得文本特征向量为图像特征向量添加注意力;将融合特征向量组输入至分类识别模型中,得到违规识别结果。本文使用交叉注意力机制融合两种模态特征,可提升违规图像识别的性能及鲁棒性。