BriefGPT.xyz
Ask
alpha
关键词
minibatch sgd
搜索结果 - 2
平滑景观增强了 SGD 的信号:学习单指数模型的最优样本复杂度
本文研究在高斯分布下学习单指标模型 σ(w⁎・x),以及学习该模型时信息指数 k * 的影响,论文提出了利用平滑误差函数与在线随机梯度下降等方法,减少样本数对模型的学习。
PDF
a year ago
异构分布式学习中的小批量对比本地 SGD
本文研究异构分布共享的随机梯度下降优化问题,通过对比 Local SGD 和 Minibatch SGD,得到加速的 Minibatch SGD 是解决高异质性问题的最优方法,并提出了第一个比 Minibatch SGD 更好的 Local
→
PDF
4 years ago
Prev
Next