Oct, 2023

对抗样本不是真实特征

TL;DR对抗性示例的存在多年来一直是一个谜团,吸引了广泛的兴趣。本文从一个更大的背景视角重新审视这个理论,发现非鲁棒特征不像人类视为噪声特征那样有用,而具有良好转移性的鲁棒或自然特征更加有用。同时,我们还展示了经过鲁棒特征培训的编码器在 AutoAttack 下仍然是非鲁棒的,这表明仅凭鲁棒特征可能无法获得可靠的模型鲁棒性。