May, 2022

L2 正则化 DNN 中的特征学习:吸引 / 排斥和稀疏性

TL;DR本研究探讨使用 $L_{2}$ 正则化的 DNNs 的损失曲面,并证明了通过特征学习来实现最优隐藏表示,以及如何通过隐藏表示的协方差来证明 $N (N+1)$ 神经元的局部最小值,并且在传统设置中远不需要 $N^{2}$ 神经元即可达到最小值。