Jul, 2023

R-Cut: 使用关系加权输出和剪切技术提升视觉变换器的可解释性

TL;DR这篇论文提出了一种新方法,通过提供类别特定的可视化地图,改进了基于 Transformer 的图像分类模型的可解释性,从而提高分类结果的可信度,并赋予用户对后续任务更深入的理解。通过引入 “Relationship Weighted Out” 和 “Cut” 模块,从中间层提取类别特定信息并突出相关特征,实现了精细的特征分解,考虑了位置、纹理和颜色等因素。通过在 ImageNet 数据集上进行广泛的定性和定量实验证实了该方法的有效性,并在专门用于自动驾驶危险预警的 LRN 数据集上进行了大量实验,评估了方法在复杂背景下的可解释性,结果表明其显著优于现有方法。此外,我们还进行消融实验,验证了每个模块的有效性,从而进一步证实了我们提出的方法的整体有效性。