May, 2024

利用深层模型的分层内在维度进行实用对抗训练

TL;DR通过改进的 Adversarial Training 算法 SMAAT,本研究提供了 vision 和 language 模型在 generalization 和 robustness 趋势差异的首个解释,同时展示了 SMAAT 在多个任务中显著提高了鲁棒性,且相比于标准的 AT 仅需约 25-33% 的 GPU 时间。