一种基于自注意力机制的图像分类方法
基本信息
申请号 | CN202110723547.4 | 申请日 | - |
公开(公告)号 | CN113378973A | 公开(公告)日 | 2021-09-10 |
申请公布号 | CN113378973A | 申请公布日 | 2021-09-10 |
分类号 | G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 杨木润;赵闯 | 申请(专利权)人 | 沈阳雅译网络技术有限公司 |
代理机构 | 沈阳新科知识产权代理事务所(特殊普通合伙) | 代理人 | 李晓光 |
地址 | 110004辽宁省沈阳市和平区三好街78号东软电脑城C座11层 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种基于自注意力机制的图像分类方法,步骤为:构建包含自注意力机制的Transformer模型,针对图像分类任务添加分类器单元;处理公开数据集ImageNet,调整原图片至合适大小;将调整后的图片划分成固定大小的子图,连接各子图后进行维度调整,得到图片嵌入向量;进行二维位置编码,得到二维位置编码向量,和图片嵌入向量连接,作为模型输入;将连接后向量送入Transformer模型,提取图片特征,最终解码时通过分类器单元将模型输出的向量转换成概率表示,完成图像分类。本发明通过自注意力机制的使用,能够有效地从图片中提取全局信息,即传统卷积神经网络所提取的图片特征,基于提取的特征能够有效地完成对图片的分类。 |
