ICMLAug, 2023

视觉 Transformer 中的多样特征学习以提高泛化性能

TL;DR通过修剪与不必要特征相关的注意力头和鼓励输入梯度正交性,我们提出一种方法提高深度学习模型对分布变化的适应性并增加特征的多样性和互补性。