Jun, 2024

用随机性对抗随机性:使用延迟集成和噪声插值减轻微调的优化不稳定性

TL;DR利用集成、噪音正则化和模型插值技术,我们提出了一种名为 DENI(Delayed Ensemble with Noisy Interpolation)的新型缓解策略,它既具备高效计算的特点,又能有效克服细调整中的不稳定性问题。通过在 3 种模型、4 种调优策略和 7 个文本分类数据集上对比 DENI 与其他 9 种缓解策略,我们证明了:1)DENI 优于表现最佳的缓解策略(Ensemble),且仅使用其计算成本的一小部分;2)缓解策略对于参数高效的细调整方法(PEFT)非常有效,在某些情况下超过了完整细调整方法的性能;3)将 DENI 与数据增强相结合通常会导致更有效的稳定性缓解。