Oct, 2023

ScaleLong: 通过缩放网络长跳连接实现扩散模型更稳定的训练

TL;DRUNet 的长跳连接系数对其前向和反向传播的稳定性以及鲁棒性有重大影响,理论解释了 UNet 训练的不稳定性,通过 LSC 系数缩放来提高训练稳定性