Sep, 2020

Apollo: 一种自适应参数逐个对角线拟牛顿法在非凸随机优化中的应用

TL;DR介绍了一种名为 Apollo 的准牛顿法,通过对损失函数的海塞矩阵进行对角矩阵逼近,使算法的时间复杂度和内存占用保持在线性复杂度上,同时实现了对非凸优化的处理。实验结果表明,Apollo 相对于 SGD 和 Adam 等随机优化方法在收敛速度和泛化性能上都有显著提高。