基于多模态预训练的相似图片检索方法、装置及电子设备
基本信息
申请号 | CN202210376939.2 | 申请日 | - |
公开(公告)号 | CN114461839A | 公开(公告)日 | 2022-05-10 |
申请公布号 | CN114461839A | 申请公布日 | 2022-05-10 |
分类号 | G06F16/583(2019.01)I;G06V10/778(2022.01)I;G06V10/74(2022.01)I;G06V10/774(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 孟凡飞;李飞阳;薛娇;李大海 | 申请(专利权)人 | 智者四海(北京)技术有限公司 |
代理机构 | 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人 | - |
地址 | 100000北京市海淀区学院路甲5号1幢三层1#厂房3-011 | ||
法律状态 | - |
摘要
摘要 | 本申请提供了一种多模态预训练的相似图片检索方法、装置及电子设备,该方法包括:获取图片特征编码器,所述图片特征编码器是与文本编码器共同经多模态预训练得到的;基于所述图片特征编码器,获取待检索图片及图片数据库中图片的图片特征;基于所述待检索图片及图片数据库中图片的图片特征,从图片数据库中召回具有与所述待检索图片的特征相似的图片数据,作为召回图片数据;对所述召回图片数据进行排序,将最近邻的数据返回,作为所述待检索图片的检索结果。本申请通过多模态预训练、图片特征提取、相似图片召回、相似性排序,实现从海量的图片数据中,高效且准确的为一张图片检索出一组语义上和内容上相似的图片。 |
