大分辨率图像的目标检测和识别方法及装置
基本信息
申请号 | CN202210255384.6 | 申请日 | - |
公开(公告)号 | CN114332456A | 公开(公告)日 | 2022-04-12 |
申请公布号 | CN114332456A | 申请公布日 | 2022-04-12 |
分类号 | G06V10/25(2022.01)I;G06V10/26(2022.01)I;G06V10/774(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 张凯;马乐乐;崔超然;逯天斌 | 申请(专利权)人 | 山东力聚机器人科技股份有限公司 |
代理机构 | 北京中和立达知识产权代理有限公司 | 代理人 | 孟姣 |
地址 | 276808山东省日照市岚山区安东卫街道玉泉二路99号(岚山区科技孵化器电商创业园) | ||
法律状态 | - |
摘要
摘要 | 本发明涉及图像识别技术领域,是关于一种大分辨率图像的目标检测和识别方法及装置,方法包括:获取大分辨率图像集,进行数据增强,得到增强后的图像集;对增强后的图像集中的每个原始图像进行分割,得到对应的子图像及其位置信息;对子图像及其位置信息进行编码和融合处理,以得到对应的数据张量;基于Faster R‑CNN模型,对数据张量进行逐层特征表示学习,采用注意力机制对Faster R‑CNN模型的低层信息、中层信息和高层信息进行融合,确定子图像对应的特征表示,进而确定候选目标位置,进行回归和分类,以确定最终目标位置及其所属的类别;根据最终目标位置及其所属的类别确定原始图像的最终目标位置及其所属的类别。通过该方案,提升了最终的模型性能。 |
