Oct, 2023

何时、为何以及何倍?通过优化改进的自适应学习率调度

TL;DR学习率调度与优化算法的收敛性分析、学习率预热和调度优化方法的研究。