Jun, 2020

神经切向核调节下随机梯度下降平均最优收敛速度

TL;DR本文通过利用目标函数和 NTK 相关的函数空间的特殊属性,证明了平均随机梯度下降方法在 NTK 极限下能够取得最小极小化误差率,并利用 ReLU 网络的平滑逼近,使得可以在最优极小化误差率下学习 NTK 指定的目标函数。