Oct, 2023

具有可定制扭曲的图像分类器稳健性基准生成框架

TL;DR我们提出了一个新颖的框架,用于生成对抗性基准测试,以评估图像分类模型的鲁棒性。我们的框架允许用户定制应用于图像的最佳失真类型,从而帮助解决与其部署相关的特定失真问题。该基准测试可以生成不同失真水平的数据集,评估不同图像分类器的鲁棒性。我们的结果表明,我们的框架生成的对抗性样本在任何图像分类模型(如 ResNet-50、Inception-V3 和 VGG-16)上都是有效的并且具有传递性,导致其他模型失效。即使使用最先进的技术对这些模型进行对抗式重训练,这些失败仍然会发生,证明了我们对抗性样本的泛化能力。我们在 CIFAR-10 和 ImageNet 上的净 $L_2$ 失真方面取得了与最先进基准技术具有竞争性的性能;然而,我们的框架是通过简单的失真(如高斯噪声)实现这些结果的,而不引入不自然的伪影或颜色渗透。这得益于基于模型的强化学习(RL)代理和将对图像的深度树搜索减少到一级分析和动作的技术,来降低模型对扰动的敏感性。选择失真类型和设置多类别分类概率阈值的灵活性使得我们的框架适用于算法审核。