May, 2024

分位点激活:离开单点估计以获得更好的对扭曲的泛化能力

TL;DR通过将每个神经元的输出调整为其上下文分布,本文提出了量化激活(QACT)方法,该方法在简单网络中输出样本在其上下文分布中的相对分位数,以实现跨分布的更好泛化。我们验证了该方法在几个实验设置上的有效性,并将其与传统技术进行比较,结果表明我们在对抗扭曲的不同架构下实现了显著更高的泛化性能。尽管本文只是一个概念验证,但令人惊讶的是,即使 DINOv2 使用更大的网络和更大的数据集进行训练,在大的扭曲下该方法依然胜过 DINOv2(small)模型。