BriefGPT.xyz
Mar, 2024
理解具有条件最优输运的无限深度和宽度的 ResNet 的训练
Understanding the training of infinitely deep and wide ResNets with Conditional Optimal Transport
HTML
PDF
Raphaël Barboni, Gabriel Peyré, François-Xavier Vialard
TL;DR
该研究探讨深度神经网络训练中的梯度流收敛问题,并提出了一种基于条件最优传输距离的训练模型,通过梯度流方程的良定性和多项式-Lojasiewicz分析证明了在适当的初始化条件下,梯度流可以收敛于全局极小值。
Abstract
We study the
convergence
of
gradient flow
for the training of
deep neural networks
. If
→