特征编码模型、视觉关系检测模型的训练方法及检测方法

基本信息

申请号 CN201910650283.7 申请日 -
公开(公告)号 CN110390340B 公开(公告)日 2021-06-01
申请公布号 CN110390340B 申请公布日 2021-06-01
分类号 G06K9/46(2006.01)I;G06K9/62(2006.01)I;G06K9/68(2006.01)I 分类 计算;推算;计数;
发明人 朱艺;梁小丹;林倞 申请(专利权)人 暗物智能科技(广州)有限公司
代理机构 北京三聚阳光知识产权代理有限公司 代理人 李红团
地址 511458广东省广州市南沙区丰泽东路106号(自编1号楼)X1301-G5994(集群注册)(JM)
法律状态 -

摘要

摘要 本发明涉及视觉关系检测技术领域,具体涉及特征编码模型、视觉关系检测模型的训练方法及检测方法;其中,特征编码模型的训练方法包括获取初始特征编码模型;获取样本数据;将每个样本数据输入初始特征编码模型中;基于类别从视觉常识数据中提取引导图;根据引导图对初始特征编码模型进行训练,调整转换矩阵,以对每个目标区域的目标特征进行更新,得到每个目标区域的目标特征编码。利用视觉常识中与该类别相关的引导图一方面弥补了样本数据不足的缺陷,使得在对目标特征进行再次编码时能够有足够的样本数据支撑,另一方面保证了目标特征编码时就已经引入关系感知,为后续视觉关系的检测提供的条件,进而能够提高视觉关系检测的准确率。