CVPRJun, 2024

从方差到真实性:在可微束调整层中解构和减轻梯度方差

TL;DR通过使用在训练问题中预测的权重来降低梯度方差,从而减轻异常值的影响,我们提出了一个简单但有效的解决方案,以实现更快的训练速度并在不牺牲性能的情况下在不同的训练设置中更具灵活性。