Feb, 2015

非凸优化的平衡自适应学习率

TL;DR该论文提出了一种基于 equilibration preconditioner 的新型自适应学习率方法:ESGD,与 RMSProp 相比收敛速度更快,在非凸问题上表现更好。