CVPRAug, 2022

DropKey

TL;DR本文重点分析和改进了 Vision Transformer 的自注意力层中关键的丢弃技术,并提出用于关键值的 dropout-before-softmax 方案和逐渐降低 dropout ratio 的方案,从而提高了 ViTs 在各种视觉任务中的效果。