一种基于双重多尺度注意力机制的图像语义分割方法

基本信息

申请号 CN201910452050.6 申请日 -
公开(公告)号 CN110163878A 公开(公告)日 2019-08-23
申请公布号 CN110163878A 申请公布日 2019-08-23
分类号 G06T7/11;G06K9/62;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 高科;杨双;张弛 申请(专利权)人 南京沛亭数字科技有限公司
代理机构 北京金智普华知识产权代理有限公司 代理人 四川智盈科技有限公司
地址 610051 四川省成都市成华区迎晖路138号附1号
法律状态 -

摘要

摘要 本发明公开了一种基于双重多尺度注意力机制的图像语义分割方法,属于图像语义分割领域。该方法包括:对训练图像和测试图像进行预处理;构建图像语义分割模型;将预处理后的训练图像送入图像语义分割模型,得到预测输出;根据预测输出与真实值的差异计算损失函数值,并调优模型参数;待到达预定训练次数后,停止训练,并固定图像语义分割模型参数;输入预处理后的测试图像,利用图像语义分割模型参数输出测试图像的预测图,即为所述测试图像对应的图像语义分割结果图。本发明充分增强进而有效捕捉图像中的小目标信息,且可以通过不同尺度下目标周边的上下文信息的结合,解决易混淆目标的区分问题,进而可以得到较好的图像语义分割结果。