BriefGPT.xyz
Ask
alpha
关键词
armijo line search
搜索结果 - 3
优化大规模神经网络训练的线搜索方法
使用线搜索方法改进了传统随机梯度下降技术,通过在搜索方向中整合 ADAM 的动量项,实现了高效的大规模训练,提高了性能。
PDF
3 months ago
使用线搜索方法加速 Transformer 微调的收敛
本研究成功将线搜索方法应用于新颖且受欢迎的 Transformer 架构和自然语言处理数据领域,通过将网络架构细分为合理的单元并在这些局部单元上进行线搜索,将 Armijo 线搜索与 Adam 优化器结合,其优化方法在小数据集或小训练预算的
→
PDF
3 months ago
随机梯度下降的非凸优化中批处理大小与所需步数的关系
随机梯度下降是最简单的深度学习优化器之一,该论文通过蒙特卡洛方法对其进行了收敛性分析,并证明了使用 Armijo 线搜索的随机梯度下降在非凸优化中的性能优于其他深度学习优化器,同时还发现了批量大小对训练的影响,批量大小越大,需要的步数越少,
→
PDF
a year ago
Prev
Next