关键词transferable adversarial examples
搜索结果 - 5
- 重新审视可转移对抗图像示例:攻击分类、评估准则和新见解
通过建立新的评估准则,我们在 ImageNet 上对 23 种典型攻击与 9 种代表性防御进行了首次大规模的可传递对抗样本评估,发现既有的评估存在误导性结论和遗漏点,从而阻碍了该领域的实际进展评估。
- 在像素级别释放视觉提示的威力
本文提出一种简单且有效的视觉提示方法,用于将预训练模型适应下游识别任务。并重新引入了两种常用技术,即输入多样性和梯度归一化。该方法在 12 个流行的分类数据集上创造了 82.8%的平均准确率的记录,并提供了代码。
- AAAI利用数据集的潜力:一种面向数据的方法提高模型的鲁棒性
通过优化数据集来提高深度神经网络模型的强健性,我们通过添加可转移的对抗性示例和常见数据损坏方式来增强数据集,并在阿里巴巴和清华大学举行的数据中心强化学习竞赛中获得第三和第四名。
- 对抗样本游戏
本文提出 Adversarial Example Games (AEG),一种基于 min-max 博弈的生成对抗样本方法,实现了在给定假设类别的基础上训练生成器和分类器,证明了该方法能生成可攻击对应假设类别中所有分类器的对抗样本,实验表明 - ICLR基于 $L_1$ 的对抗样本攻击 Madry 防御模型
研究通过实验结果证明,通过放宽对 L-infinity 约束条件,深度神经网络的弹性网络(EAD)可以构建可传递的对抗样本,这些样本具有最小的视觉失真度。这些结果对于通过最小化 L-infinity 距离来评价对抗性攻击的视觉失真度的有效性