ICCVAug, 2023

关于层标准化调整在视觉 Transformer 连续学习中的有效性

TL;DR通过回顾和扩展简单的迁移学习思想:学习任务特定的归一化层,我们在维持竞争性性能的同时降低了计算成本,在 ImageNet-R 和 CIFAR-100 实验中,我们的方法在计算上更加经济且结果要么优于现有技术水平,要么与其相媲美。