一种基于伪标签筛选的异构域自适应方法、装置及设备

基本信息

申请号 CN202210150906.6 申请日 -
公开(公告)号 CN114219047A 公开(公告)日 2022-03-22
申请公布号 CN114219047A 申请公布日 2022-03-22
分类号 G06K9/62(2022.01)I;G06N20/00(2019.01)I 分类 计算;推算;计数;
发明人 陆玉武;林德伟 申请(专利权)人 深圳大学
代理机构 深圳中一联合知识产权代理有限公司 代理人 杨志强
地址 518060广东省深圳市南山区粤海街道南海大道3688号
法律状态 -

摘要

摘要 本申请提供了一种基于伪标签筛选的异构域自适应方法,该方法利用投影矩阵将文字样本和图像样本投影到公共子空间上生成投影样本,投影样本的边缘分布对齐,保留投影样本中标记投影样本的判别性知识,投影样本与文字样本和图像样本的信息损失尽可能少;基于标记投影样本,利用第c类的文字样本和第c类的图像样本确定第c类的投影样本的均值向量;基于第c类的投影样本的均值向量确定第c类投影样本的均值向量和每个未标记图像投影样本的特征相关系数;基于每个未标记图像投影样本的特征相关系数,在多个未标记投影样本中筛选出具有高特征相关系数的训练子集。本申请提供的方法实现了未标记图像投影样本中的伪标签的筛选,提高了模型的训练精度。