关键词adversarial benchmarks
搜索结果 - 2
- ADVSCORE:对对抗性基准评估与创建的度量
通过 ADVSCORE 量化和揭示数据集的对抗特征,同时使用 ADVSCORE 评估高质量对抗数据集,验证其在愚弄模型而不愚弄人类方面的能力,并揭示人类写作所使用的愚弄模型而不愚弄人类的对抗策略,从而指导揭示语言模型的弱点和生成可靠的对抗样 - 具有可定制扭曲的图像分类器稳健性基准生成框架
我们提出了一个新颖的框架,用于生成对抗性基准测试,以评估图像分类模型的鲁棒性。我们的框架允许用户定制应用于图像的最佳失真类型,从而帮助解决与其部署相关的特定失真问题。该基准测试可以生成不同失真水平的数据集,评估不同图像分类器的鲁棒性。我们的