分割视频物体的方法、装置以及网络模型训练方法
基本信息
申请号 | CN202110587943.9 | 申请日 | - |
公开(公告)号 | CN113506316A | 公开(公告)日 | 2021-10-15 |
申请公布号 | CN113506316A | 申请公布日 | 2021-10-15 |
分类号 | G06T7/246(2017.01)I;G06K9/32(2006.01)I;G06K9/34(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 熊鹏飞;王培森 | 申请(专利权)人 | 北京迈格威科技有限公司 |
代理机构 | 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人 | 安卫静 |
地址 | 100090北京市海淀区科学院南路2号融科资讯中心A座316-318 | ||
法律状态 | - |
摘要
摘要 | 本申请实施例提供分割视频物体的方法、装置以及网络模型训练方法,所述分割视频物体的方法包括:提取当前帧图像之前的至少一张历史帧图像的特征,得到所述至少一张历史帧图像中各历史帧图像的特征对;提取所述当前帧图像的特征,得到当前帧图像的特征对;提取所述当前帧图像的特征,得到当前帧的特征对;根据所述各历史帧图像的特征对、所述当前帧图像的特征对和解码器,获取所述当前帧图像中感兴趣目标的分割掩膜;其中,所述至少一张历史帧图像中的各历史帧图像是所述当前帧图像的前一帧或多帧图像,所述特征对包括键矩阵和值矩阵。本申请的一些实施例通过一个增强型短时记忆网络实现帧间跟踪,显著提升了对当前帧图像的视频物体分割精度。 |
