BriefGPT.xyz
Ask
alpha
关键词
overparameterized neural network
搜索结果 - 2
过度参数化对锐度感知最小化的影响:实证与理论分析
训练过参数的神经网络可以得到相同训练损失水平但具有不同泛化能力的极小值。本文分析了过参数化对锐度感知最小化策略(SAM)行为的关键影响,并提供了经验和理论结果,表明过参数化对 SAM 具有重要影响。具体而言,我们证明了在随机设置中 SAM
→
PDF
7 months ago
从 tempered 到 benign 的 ReLU 神经网络过拟合
本文研究过参数神经网络的过拟合现象,并证明了在不同的维度下会出现不同种类的过拟合现象,包括良性过拟合和温和过拟合,并解释了这些现象与样本大小、网络结构等因素的相关性。
PDF
a year ago
Prev
Next