Jan, 2024

视觉转换器嵌入空间的引人注目的等效结构

TL;DR基于视觉转换器作为例子,通过分析和系统实验,我们展示了表示空间由大型分段线性子空间和局部正常空间组成,存在着不同输入具有相同表示和在视觉上难以区分的不同表示的输入。这些经验结果进一步通过基础模型的局部方向估计来验证。因此,得到的表示会改变下游模型的结果,并且这样的模型容易过度泛化且具有有限的迁移能力。