Oct, 2023

随机梯度下降的噪声几何:定量和分析性特征化

TL;DR本文对超参数化线性模型和两层神经网络的噪声几何进行全面的理论研究,揭示了随机梯度下降在逃离尖锐极小值时存在沿平坦方向的显著分量。