一种RGB-D双模态特征融合的语义分割方法
基本信息
申请号 | CN202210330691.6 | 申请日 | - |
公开(公告)号 | CN114693929A | 公开(公告)日 | 2022-07-01 |
申请公布号 | CN114693929A | 申请公布日 | 2022-07-01 |
分类号 | G06V10/26(2022.01)I;G06V10/44(2022.01)I;G06V10/764(2022.01)I;G06V10/82(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 方艳红;罗盆琳 | 申请(专利权)人 | 西南科技大学 |
代理机构 | - | 代理人 | - |
地址 | 621010四川省绵阳市涪城区青龙大道中段59号 | ||
法律状态 | - |
摘要
摘要 | 本发明提出一种RGB‑D双模态特征融合语义分割方法。首先,使用轻量化的ResNet34架构作为双分支编码主干,分四个阶段提取不同模态特征信息,逐层将输出的不同模态特征图传入双模态特征融合结构,通过注意力感知需要加强和削减的位置和空间特征,融合后的特征送入跳跃链接模块,为解码网络提供浅层细节信息;然后,采用双注意上下文模块丰富最底层特征图全局信息并连接解码器;最后,将来自编码器子网的浅层、低层、细粒度特征与来自解码器子网的深度、语义、粗粒度的相同尺度特征图结合在一起,获取包含低级空间和高级语义信息的全局特征。本发明能充分利用RGB‑D图像的互补特征,得到优异的语义分割性能,分割效果较好,运行效率高,具有较好的鲁棒性。 |
