一种基于双重多尺度注意力机制的图像语义分割方法
基本信息
申请号 | CN201910452050.6 | 申请日 | - |
公开(公告)号 | CN110163878A | 公开(公告)日 | 2019-08-23 |
申请公布号 | CN110163878A | 申请公布日 | 2019-08-23 |
分类号 | G06T7/11;G06K9/62;G06N3/04;G06N3/08 | 分类 | 计算;推算;计数; |
发明人 | 高科;杨双;张弛 | 申请(专利权)人 | 南京沛亭数字科技有限公司 |
代理机构 | 北京金智普华知识产权代理有限公司 | 代理人 | 四川智盈科技有限公司 |
地址 | 610051 四川省成都市成华区迎晖路138号附1号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于双重多尺度注意力机制的图像语义分割方法,属于图像语义分割领域。该方法包括:对训练图像和测试图像进行预处理;构建图像语义分割模型;将预处理后的训练图像送入图像语义分割模型,得到预测输出;根据预测输出与真实值的差异计算损失函数值,并调优模型参数;待到达预定训练次数后,停止训练,并固定图像语义分割模型参数;输入预处理后的测试图像,利用图像语义分割模型参数输出测试图像的预测图,即为所述测试图像对应的图像语义分割结果图。本发明充分增强进而有效捕捉图像中的小目标信息,且可以通过不同尺度下目标周边的上下文信息的结合,解决易混淆目标的区分问题,进而可以得到较好的图像语义分割结果。 |
