Dec, 2022

教学至关重要:探讨监督在视觉Transformer中的作用

TL;DR研究显示ViTs在不同的学习方法下能够学习不同的行为,并发现了一些在不同学习方法下相似的ViT行为,比如Offset Local Attention Heads。同时发现对比自监督方法学习的特征与显式监督方法学习的特征竞争力相当,并且在某些情况下对于部分任务还优于显式监督方法。此外,基于重构模型的表示与对比自监督模型的表示存在非平凡的相似性。