Jan, 2024

SPFormer:使用超像素表示增强视觉 Transformer

TL;DRSPFormer 是一种新颖的视觉变换器,增强了超像素表示,通过对图像内容进行自适应划分,有效捕捉了复杂的细节,并在各种基准测试中表现出优异性能。其独特的可解释性结构提供了对模型内部过程的洞察,显著提高了 SPFormer 的稳健性。