一种基于实例分割的图像语义描述改进方法

基本信息

申请号 CN202111548600.8 申请日 -
公开(公告)号 CN114220095A 公开(公告)日 2022-03-22
申请公布号 CN114220095A 申请公布日 2022-03-22
分类号 G06V20/70(2022.01)I;G06V10/40(2022.01)I;G06V10/80(2022.01)I;G06V10/82(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 胡皓晖;王云;周焕来;李玉琳;余梦鹏;张诗涵;陈昊男;贾海涛 申请(专利权)人 一拓通信集团股份有限公司
代理机构 - 代理人 -
地址 210000江苏省南京市自贸区南京片区浦滨路320号科创一号大厦B座701室
法律状态 -

摘要

摘要 本发明属于图像描述领域,具体涉及一种基于实例分割的图像语义描述的改进方法。随着图像语义理解技术的发展,如何能有效的提取图像中蕴藏的高层语义信息成为科研工作者中热门研究的课题,但目前为止图像描述任务依然没有达到令人满意的效果。图像描述试图通过一句话描述图像的全部内容,但是实现图像描述的经典的编解码框架在编码端往往尝试使用基于网格划分和目标检测的卷积神经网络来提取图像特征,使得提取图像特征中容易丢失背景信息,或者不同区域的特征存在信息重合的问题,从而导致生成描述的语句出现丢失重点信息或者信息冗余的问题。因此本发明对基于编解码框架的的图像语义描述算法进行了相应改进,提高编码器提取图像特征的能力,从而使得生成的描述语句更加准确。