Jun, 2023

神经网络优化路径的简单几何

TL;DR本研究探讨了神经网络中采样梯度沿优化路径的基本几何特性,发现这些特性在大多数训练期间保持稳定动态,并提供了线性收敛的理论保证和反映经验实践的学习率计划。