Jan, 2025
在视觉变换器中利用寄存器实现强健适应
Leveraging Registers in Vision Transformers for Robust Adaptation
TL;DR本文针对视觉变换器(ViTs)在无监督对象发现中因高范数token干扰而导致的泛化问题,提出了使用“寄存器”来隔离这些高范数token的方法。研究表明,结合寄存器嵌入与传统CLS token嵌入可以有效提高模型在分布外(OOD)场景下的泛化能力和异常检测的准确性,同时保持分布内(ID)性能,整体提升了2-4%的OOD准确率和2-3%的异常检测假阳性率。