Apr, 2024

残差连接对自监督抽象特征学习的影响

TL;DR利用加权因子来衰减残差网络内部的标识快捷方式,大大提高了最先进的自监督掩码自编码(MAE)范式中的语义特征学习。我们在 MAE 的 VIT-B/16 骨干网络中对标识快捷方式进行了修改,将 ImageNet 上的线性探测准确度从 67.3% 提升至 72.3%。这个显著差距表明,残差连接结构在促进梯度传播方面发挥了重要作用,但由于将较浅层次的表示注入到更深层次中,它可能对抽象学习的能力产生副作用。我们通过固定公式逐渐减少标识连接的贡献来解决这个问题,这不会影响网络的可训练性。通过分析我们修改后的残差网络学习到的表示,我们发现低有效特征排名与下游任务性能之间存在相关性。