一种视觉显著性预测方法及设备
基本信息
申请号 | CN202010789004.8 | 申请日 | - |
公开(公告)号 | CN112040222A | 公开(公告)日 | 2020-12-04 |
申请公布号 | CN112040222A | 申请公布日 | 2020-12-04 |
分类号 | H04N17/00;G06T7/00 | 分类 | 电通信技术; |
发明人 | 廖建鑫;邹文斌;庄越;卓圣楷;邹辉;李霞;袁涛 | 申请(专利权)人 | 深圳市慧视智联科技有限公司 |
代理机构 | 深圳市君胜知识产权代理事务所(普通合伙) | 代理人 | 深圳大学;深圳市慧视智联科技有限公司 |
地址 | 518060 广东省深圳市南山区南海大道3688号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种视觉显著性预测方法及设备,通过获取待检测视频;所述待检测视频含有多个视频帧,且多个所述视频帧中均含有目标注视物;将待检测视频输入已训练的显著性预测模型,得到与所述待检测视频相对应的显著性图;其中,显著性预测模型包括编码端和解码端;所述编码端包括多个用于分配各个视频帧所占权重的帧间注意力模块,所述解码端包括多个用于对输入的空间特征上采样和对输入的时间特征降维的自适应上采样模块。本实施例中由于在显著性预测模型的编码端加入帧间注意力模块,以增加帧间传递的时间特征信息,以及在解码端加入自适应上采样模块,以优化空间特征,提高了人眼注视点预测的精确性和人眼注视点转移捕捉的鲁棒性。 |
