BriefGPT.xyz
Ask
alpha
关键词
heavy-tailed behavior
搜索结果 - 2
离线(多通道)随机梯度下降法中的近似重尾问题
我们研究了随机梯度下降(SGD)在实际环境中可能展现出重尾行为,并且尾部的重度可能与整体性能有相关性。我们的贡献在于填补了单次通过(online)SGD 和多次通过(offline)SGD 之间在实际数据量有限情况下,生成重尾行为的机制仍不
→
PDF
8 months ago
带剪辑的非凸随机优化的高概率分析
使用梯度裁剪技术在随机优化算法中研究梯度的截尾行为和其理论保证。
PDF
a year ago
Prev
Next