Jul, 2024
预条件共轭梯度递归发现具有尖锐概括性的过度参数化神经网络用于非参数回归
Preconditioned Gradient Descent Finds Over-Parameterized Neural Networks
with Sharp Generalization for Nonparametric Regression
TL;DR我们考虑使用梯度下降或其变种训练过度参数化的二层神经网络进行非参数回归,并证明了在神经网络使用经典梯度下降方法配合早停止训练时,当目标函数具有在深度学习文献中广泛研究的谱偏差时,训练后的网络提供了更尖锐的广义界限,具有最小化的最优速率。