BriefGPT.xyz
Ask
alpha
关键词
overfit
搜索结果 - 2
重拾被遗忘的知识:关于遗忘、过拟合和无需训练的深度神经网络集成
在深度神经网络中,我们引入一种新的评分方法来衡量过拟合,该方法通过监测验证数据上的模型遗忘率,从而揭示了即使总体上泛化能力得到改善,仍存在数据空间中某些区域泛化能力退化的情况。基于这些观察,我们构建了一种新的集成方法,该方法仅基于单个网络的
→
PDF
9 months ago
Shake-Shake 正则化
本文介绍了一种替换标准分支求和的随机仿射组合方法,用于改善深度学习中过拟合问题,结合掷骰子正则化可提高 CIFAR-10 和 CIFAR-100 测试准确度,对于跳跃连接或批量归一化的架构也有鼓舞人心的结果,具有广泛的应用前景。
PDF
7 years ago
Prev
Next