BriefGPT.xyz
Ask
alpha
关键词
decentralized variants
搜索结果 - 1
分散随机梯度下降的稳定性和泛化能力
本论文提出了分散化随机梯度下降法的新方法,并使用(非)凸优化理论建立了第一个针对分散化随机梯度下降法的稳定性和泛化保证。我们的理论结果基于少数常见且温和的假设,并揭示分散化将首次降低 SGD 的稳定性。通过使用多种分散化设置和基准机器学习模
→
PDF
3 years ago
Prev
Next