基于ViT的深度学习神经网络数据增强方法

基本信息

申请号 CN202210174016.9 申请日 -
公开(公告)号 CN114548405A 公开(公告)日 2022-05-27
申请公布号 CN114548405A 申请公布日 2022-05-27
分类号 G06N3/08(2006.01)I;G06N3/04(2006.01)I 分类 计算;推算;计数;
发明人 吴均城;王华龙;杨海东;李泽辉;魏登明 申请(专利权)人 佛山市南海区广工大数控装备协同创新研究院
代理机构 广州科沃园专利代理有限公司 代理人 -
地址 528200广东省佛山市南海高新区佛高科技智库中心A座4楼
法律状态 -

摘要

摘要 本发明提供一种基于ViT的深度学习神经网络数据增强方法,S1、假定A是输入的图像,S2、TransMix在注意图的指导下分配混合标签,S3、将原始的M从H、W转换为相应的像素区域,S4、数据集使用ImageNet‑1k,S5、图像分类模型选用DeiT‑T、PVT‑T、XCiT‑T,S6、引入实现过程的pytorch伪代码,本方法简单易行且不会对模型引入任何额外参数,使训练的难度减小,本方法可以根据每个像素的显著性重新加权,不需要额外的参数和最小的计算开销;应用的TransMix是基于ViTs的注意地图混合标签,它可以弥补输入空间和标签空间之间的差距。