Sep, 2020

使用复步方向导数的二阶神经网络训练

TL;DR本文提出了一个基于二阶数值优化的深度学习算法。该算法使用复合数算法流的有限差分(CDSD)计算海森矩阵,通过监控泰勒级数的逼近误差,调整步长大小,实现了优化的同时保存良好的局部和全局收敛性,在深度学习任务中表现优异。