Jun, 2023

梯度下降中的简约法则用于学习深度线性网络

TL;DR研究了深线性网络的学习动态,发现梯度下降的内在偏差与节俭的解决方案有关,特别地,当数据具有低维结构时,只在每个权重矩阵的一个小不变子空间内进行学习,从而提高了效率和理解深度学习。