BriefGPT.xyz
Ask
alpha
关键词
wasserstein convergence rates
搜索结果 - 1
通过最优传输证明神经网络的线性模式连接性
理论上解释了以往实验观察到的两次随机训练之后找到的两个不同解经常通过简单连续路径(例如线性)通过权重的排列变换相连的现象,基于经验测度的 Wasserstein 距离的收敛速度,我们证明了用随机梯度下降训练的足够宽的两层神经网络的线性连接性
→
PDF
8 months ago
Prev
Next