ICLRMar, 2023
具有阈值激活函数的神经网络全局优化训练
Globally Optimal Training of Neural Networks with Threshold Activation Functions
Tolga Ergen, Halil Ibrahim Gulluk, Jonathan Lacotte, Mert Pilanci
TL;DR本文研究了具有阈值激活函数的神经网络的权重衰减正则化训练问题,发现在网络的最后一个隐藏层宽度超过一定阈值时,这些问题可以被等价地形式化为标准的凸优化问题,类似于 LASSO 方法,并且通过各种数字实验验证理论结果。