Nov, 2021

金字塔对抗训练提高 ViT 模型性能

TL;DR本研究旨在提高视觉转换器的总体性能,通过实现金字塔对抗训练(PyramidAT),同时采用适配的Dropout和随机深度正则化技术,使在分布和越界数据分类准确性之间的权衡断裂。实验结果显示,当只使用ImageNet-1K数据训练ViT-B模型时,ImageNet图像的清晰度准确性绝对值提高了1.82%,同时提高了7个ImageNet鲁棒性指标,其绝对值范围从1.76%到15.68%。