BriefGPT.xyz
Ask
alpha
关键词
overtraining
搜索结果 - 1
神经网络的泛化误差的高维动态
本文通过随机矩阵理论和线性模型中的准确解,研究了使用梯度下降训练的大型神经网络的泛化动态,发现梯度下降学习的动态自然地保护了大型网络免受过度训练和过拟合的影响,当自由参数的有效数量等于样本数量时,网络过度训练最严重,大小的适当调整可以减少网
→
PDF
7 years ago
Prev
Next