ICLRMar, 2023

使用 Mixup 进行过度训练可能损害泛化能力

TL;DR通过线性插值的方法创建合成训练样例的 Mixup 是优化 SGD 的深度模型的简单而有效的正则化技术,本文显示 Mixup 训练中的 U 形泛化曲线现象, 通过一系列数据集的实验证明了混入嘈杂标签会让 Mixup 在合成数据中出现 U 形泛化曲线现象的理论解释。