Jun, 2024

缺失图像修复:一种评估视觉转换解释方法的新框架

TL;DR借助 “Inpainting the Gaps(InG)” 这一创新的评估框架,针对计算机视觉领域中的解释方法,本研究通过修复图像中的空缺部分,降低测试时间分布漂移,提高了扰动测试的效果,并在 Vision Transformer(ViT)的三种训练策略上进行了 PartImageNet 数据集的评估,发现 Beyond Intuition 和 Generic Attribution 是最一致的解释模型,此外,该框架还在所有考虑的 ViT 模型中得到了更高和更一致的评估分数。在我们所了解的范围内,InG 是评估 ViT 解释方法的第一个半合成框架。