BriefGPT.xyz
Ask
alpha
关键词
minimax optimal convergence rates
搜索结果 - 2
ICLR
Eigencurve:具有偏斜黑塞谱的二次目标的 SGD 的最优学习速率表
提供了 Eigencurve,第一个可以在在底层 Hessian 矩阵的特征值分布呈倾斜分布时,为 SGD 优化二次目标达到了 minimax 最优收敛速率(最多提升一个常数),实现其近似的两个简单的学习速度计划,对于某些问题,其形状类似于
→
PDF
3 years ago
带洗牌的 SGD: 无需分量凸性和大的 epoch 要求的最优速率
本文研究了无替换 SGD 算法在有限和优化问题上的应用及其两种不同的指标洗牌方式(RandomShuffle 和 SingleShuffle)。作者们建立了这些算法的最小二次理论下的优化收敛率。此外,作者们进一步应用了各自分量的凸性来缩小
→
PDF
4 years ago
Prev
Next