BriefGPT.xyz
Ask
alpha
关键词
generalization curve
搜索结果 - 1
ICLR
使用 Mixup 进行过度训练可能损害泛化能力
通过线性插值的方法创建合成训练样例的 Mixup 是优化 SGD 的深度模型的简单而有效的正则化技术,本文显示 Mixup 训练中的 U 形泛化曲线现象, 通过一系列数据集的实验证明了混入嘈杂标签会让 Mixup 在合成数据中出现 U 形泛
→
PDF
a year ago
Prev
Next