Sep, 2024

一种评估机器学习分类器对抗距离的实用方法

TL;DR本文探讨了机器学习分类器在面对对抗性输入时的稳健性评估问题,指出现有计算方法在复杂模型中存在挑战。通过采用迭代对抗攻击和认证方法,提出了一种更全面的评估对抗稳健性的新方式,并发现该方法能够提供更有价值的对抗距离估计,从而推动机器学习分类器的安全使用。