Mar, 2024

优化大规模神经网络训练的线搜索方法

TL;DR使用线搜索方法改进了传统随机梯度下降技术,通过在搜索方向中整合ADAM的动量项,实现了高效的大规模训练,提高了性能。