一种基于自注意力机制的图像分类方法专利查询专利号|摘要-满商公司网

一种基于自注意力机制的图像分类方法

基本信息

申请号	CN202110723547.4	申请日	-
公开（公告）号	CN113378973A	公开（公告）日	2021-09-10
申请公布号	CN113378973A	申请公布日	2021-09-10
分类号	G06K9/62（2006.01）I;G06N3/04（2006.01）I;G06N3/08（2006.01）I	分类	计算；推算；计数;
发明人	杨木润;赵闯	申请（专利权）人	沈阳雅译网络技术有限公司
代理机构	沈阳新科知识产权代理事务所（特殊普通合伙）	代理人	李晓光
地址	110004辽宁省沈阳市和平区三好街78号东软电脑城C座11层
法律状态	-

摘要

本发明提供一种基于自注意力机制的图像分类方法，步骤为：构建包含自注意力机制的Transformer模型，针对图像分类任务添加分类器单元；处理公开数据集ImageNet，调整原图片至合适大小；将调整后的图片划分成固定大小的子图，连接各子图后进行维度调整，得到图片嵌入向量；进行二维位置编码，得到二维位置编码向量，和图片嵌入向量连接，作为模型输入；将连接后向量送入Transformer模型，提取图片特征，最终解码时通过分类器单元将模型输出的向量转换成概率表示，完成图像分类。本发明通过自注意力机制的使用，能够有效地从图片中提取全局信息，即传统卷积神经网络所提取的图片特征，基于提取的特征能够有效地完成对图片的分类。