Feb, 2024

多属性视觉转换器的高效稳健学习

TL;DR通过研究广泛任务中视觉变换器(ViTs)与卷积神经网络(CNNs)的对比,探讨了 ViTs 的多属性学习能力,并提出了通过单个 ViT 网络训练多个属性的简单而有效的策略。通过对 CelebA 数据集的实证研究,验证了多属性 ViTs 在对抗攻击和 Patch-Fool 等最新变换器攻击下的鲁棒性。