Feb, 2024

评估神经网络的可视连续性腐败鲁棒性相对于人类表现

TL;DR我们提出了一种视觉连续的损坏稳健性(VCR)方法,允许在范围广泛且连续的变化中评估神经网络对图像损坏的稳健性,并使用两种新颖的人类感知度量标准进行评估。通过在 14 种常用图像损坏上进行实验,并与大量的人类参与者和最新的稳健神经网络模型进行比较,我们的研究发现:1)连续损坏的稳健性评估可以揭示现有基准测试无法检测到的不足;因此,2)神经网络和人类的稳健性差距大于以往所知;最后,3)某些图像损坏对人类感知有相似的影响,为更具成本效益的稳健性评估提供了机会。