Nov, 2020

深度矩阵分解的梯度下降算法:动力学和从低秩隐含的偏差

TL;DR本文研究用于解决深度学习的隐含偏差问题的梯度下降算法动态收敛性,在线性网络和估计问题上,分析梯度下降中的 “有效秩” 动态变化,提出了矩阵低秩投影的有效秩,为理解深度学习奠定了基础。