基于ViT的深度学习神经网络数据增强方法
基本信息
申请号 | CN202210174016.9 | 申请日 | - |
公开(公告)号 | CN114548405A | 公开(公告)日 | 2022-05-27 |
申请公布号 | CN114548405A | 申请公布日 | 2022-05-27 |
分类号 | G06N3/08(2006.01)I;G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 吴均城;王华龙;杨海东;李泽辉;魏登明 | 申请(专利权)人 | 佛山市南海区广工大数控装备协同创新研究院 |
代理机构 | 广州科沃园专利代理有限公司 | 代理人 | - |
地址 | 528200广东省佛山市南海高新区佛高科技智库中心A座4楼 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种基于ViT的深度学习神经网络数据增强方法,S1、假定A是输入的图像,S2、TransMix在注意图的指导下分配混合标签,S3、将原始的M从H、W转换为相应的像素区域,S4、数据集使用ImageNet‑1k,S5、图像分类模型选用DeiT‑T、PVT‑T、XCiT‑T,S6、引入实现过程的pytorch伪代码,本方法简单易行且不会对模型引入任何额外参数,使训练的难度减小,本方法可以根据每个像素的显著性重新加权,不需要额外的参数和最小的计算开销;应用的TransMix是基于ViTs的注意地图混合标签,它可以弥补输入空间和标签空间之间的差距。 |
