Mar, 2024

理解具有条件最优输运的无限深度和宽度的 ResNet 的训练

TL;DR该研究探讨深度神经网络训练中的梯度流收敛问题,并提出了一种基于条件最优传输距离的训练模型,通过梯度流方程的良定性和多项式-Lojasiewicz分析证明了在适当的初始化条件下,梯度流可以收敛于全局极小值。