Jun, 2020

ADAHESSIAN:适应性的机器学习二阶优化器

TL;DR该论文介绍了ADAHESSIAN这种基于自适应Hessian估计的二阶随机优化算法,通过运用 Hutchinson 方法来降低其计算成本,以及采用块对角平均方法减少Hessian对角元素的方差和RMSE指数平滑法平滑Hessian对角线变化。该算法在图像分类,自然语言处理,推荐系统等任务中展现出比Adam等自适应算法更好的性能,并且每次迭代的成本与一阶优化算法相当。