BriefGPT.xyz
Ask
alpha
关键词
wide layers
搜索结果 - 2
宽神经网络作为高斯过程:深度平衡模型的教训
当 DEQ 层的宽度趋近于无穷大时,它收敛到一个高斯过程,建立了所谓的神经网络和高斯过程 (NNGP) 的对应关系,这种收敛甚至在深度和宽度的极限互换的情况下也成立,这些发现为研究 DEQ 的训练和泛化提供了基础,为未来的研究奠定了基础。
PDF
9 months ago
ICML
深度线性神经网络优化中证明宽度的重要性
证明全连接线性神经网络每个隐藏层的宽度大于 $\tilde\Omega (L \cdot r \cdot d_{\mathrm {out}} \cdot \kappa^3)$ 时, 高斯随机初始化的梯度下降算法会以线性速率收敛到全局最小值,
→
PDF
5 years ago
Prev
Next