BriefGPT.xyz
Ask
alpha
关键词
deep linear neural network
搜索结果 - 2
深度线性神经网络联邦平均的神经切线核视角
使用 NTK 理论进一步提供对联邦平均(FedAvg)在训练深度线性神经网络方面全局收敛的第一个理论保证,通过实验评估验证了理论发现的正确性。
PDF
9 months ago
ICLR
深度线性神经网络梯度下降的收敛分析
本文研究在白化数据上,通过梯度下降来训练深度线性神经网络收敛到全局最优点的速度。当隐藏层数的维度不小于输入输出维度的最小值,并且初始化的权重矩阵大致平衡且初始损失小于任何秩缺失解时,可保证线性收敛。此外,在输出维度为 1 的情况下,即标量回
→
PDF
6 years ago
Prev
Next