BriefGPT.xyz
大模型
Ask
alpha
关键词
hessians
搜索结果 - 3
随机矩阵理论与神经网络的损失曲面
此篇论文利用随机矩阵理论来理解和描述神经网络的损失曲面及其谱,并应用于现代神经网络的训练方法,为随机矩阵理论在现代神经网络的理论研究中提供了重要的贡献。
PDF
a year ago
FedILC: 非独立同分布数据联邦学习中加权几何均值和不变梯度协方差
本研究提出了 FedILC 方法,利用梯度协方差和 Hessians 的几何平均来捕捉环境内部和环境之间的一致性,解决联邦网络中的域漂移问题,并在基准和真实世界数据集的实验证明了我们的算法优于传统基准和类似的联邦学习算法。
PDF
2 years ago
Newton 方法在无强凸性或 Lipschitz 梯度情况下的全局线性收敛
证明了牛顿法对于具有稳定 Hessians 的目标函数具有全局收敛的线性速度,在这一类问题中包括了许多不是强凸的函数,如逻辑回归,相比于仅在类似条件下实现次线性 $O(1/t^2)$ 收敛率的一阶方法,我们的线性收敛结果是(i)仿射不变的,
→
PDF
6 years ago
Prev
Next