Dec, 2022

Spuriosity Rankings: 为假相关性的鲁棒性分类数据

TL;DR提出了一种框架,用于基于存在的虚假线索以及图像排名,评估 ImageNet 模型的错误关联问题,通过对错误排名和正确排名的图像的准确度差距的测量(称为虚假差距),对 89 个 ImageNet 模型进行评估,发现即使是最好的模型在具有虚假线索存在的图像中也表现不佳,并且这种虚假线索的影响在不同的类别之间差异更大。