ICMLApr, 2022

理解梯度下降的不稳定收敛

TL;DR本研究从基本原理出发,探讨了机器学习中梯度下降法中步长远大于 $2/L$ 时导致不稳定收敛的现象特征和成因,结合理论和实验给出了系统的认识。