Apr, 2021

所有标记都很重要:用于训练更好的视觉 Transformer 的令牌标记

TL;DR本文提出了标记令牌(Token labeling)—— 一种用于训练高性能视觉转换器(ViTs)的新训练目标。该方法可将图像分类问题重组成多个基于令牌级别的识别问题,并为每个补丁令牌分配由机器注释器生成的单独的位置特定监督。实验表明,标记令牌可以显著且一致地提高各种 ViT 模型在广泛光谱上的性能。