一种基于稠密向量的媒体精准匹配方法及系统

基本信息

申请号 CN202010228115.1 申请日 -
公开(公告)号 CN111475666A 公开(公告)日 2020-07-31
申请公布号 CN111475666A 申请公布日 2020-07-31
分类号 G06F16/583(2019.01)I;G06K9/62(2006.01)I 分类 -
发明人 谢华腾;董淳光;邱华东 申请(专利权)人 深圳市墨者安全科技有限公司
代理机构 深圳余梅专利代理事务所(特殊普通合伙) 代理人 深圳市墨者安全科技有限公司
地址 518000广东省深圳市南山区粤海街道高新北六道27号兰光科技大楼C718房
法律状态 -

摘要

摘要 本发明公开了一种基于稠密向量的媒体精准匹配方法,其包括如下步骤:步骤S1,利用预设模型对目标媒体进行特征提取;步骤S2,构建对稠密向量提供相似度搜索和聚类的框架;步骤S3,利用所述框架对预设媒体库中的海量特征向量进行相似性搜索,得到相似媒体集;步骤S4,从所述媒体库中抽取干扰媒体,得到干扰媒体集;步骤S5,将所述相似媒体集和所述干扰媒体集同步输入至预设的检索引擎,将所述干扰媒体集中的干扰媒体混入所述相似媒体集,从而降低所述相似媒体集中非匹配媒体与所述目标媒体的近似度。本发明能够在媒体检索过程中减少过拟合现象,进而提高检索精度。