Jun, 2024

自适应随机平滑:认证对抗样本的多步防御

TL;DR提出自适应随机平滑(ARS)以对测试时自适应模型的预测结果进行认证,通过扩展使用 f - 差分隐私的随机平滑分析来认证多步骤的自适应组合,首次覆盖了有噪声输入的一般高维函数的合理自适应组合,我们将 ARS 应用于深度图像分类以认证预测结果,提供对有界 L∞范数的对抗样本的适应性防御,在 L∞威胁模型中,我们的灵活性通过高维度的输入相关掩码实现自适应,我们设计了 CIFAR-10 和 CelebA 基准测试,并展示了 ARS 将准确性提高了 2 到 5 个百分点,在 ImageNet 上,ARS 相对于标准 RS 改进了 1 到 3 个百分点。