一种基于文字表述的行人检索方法
基本信息
申请号 | CN202110311957.8 | 申请日 | - |
公开(公告)号 | CN113157974A | 公开(公告)日 | 2021-07-23 |
申请公布号 | CN113157974A | 申请公布日 | 2021-07-23 |
分类号 | G06F16/75;G06F16/783;G06K9/00;G06K9/62;G06N3/04;G06N3/08 | 分类 | 计算;推算;计数; |
发明人 | 朱继;杨少毅;褚智威;石光明;李甫;牛毅 | 申请(专利权)人 | 西安维塑智能科技有限公司 |
代理机构 | 西安智萃知识产权代理有限公司 | 代理人 | 王畅阳 |
地址 | 710018 陕西省西安市凤城十路99号 | ||
法律状态 | - |
摘要
摘要 | 本发明提出一种基于文字表述的行人检索方法,包括步骤1:在全局神经网络分支中,提取图像和文字的全局特征;步骤2:在细粒度神经网络分支中,通过引入关注度机制的神经网络,提取图像和文字相互对应的细粒度特征;步骤3:在粗粒度神经网络分支中,将步骤2中提取的细粒度图像和文字特征分别输入到图卷积神经网络中,将人体结构的先验信息嵌入到所提取的特征中;步骤4:分别计算步骤1‑3所述三个神经网络分支相对应的图像和文字特征的余弦相似度并求和,作为图像和文字的最终相似度;步骤5:比较文字表述和行人图像库中每张行人图像的余弦相似度,选取相似度最高的行人图像作为行人检索的匹配结果;本方法提高了行人检索的准确率和鲁棒性。 |
