Nov, 2016

比梯度下降法更快地找到局部极小值

TL;DR本文介绍了一种非凸二阶优化算法,其时间复杂度与样本维度和训练样本数量呈线性关系,在训练神经网络和其他非凸目标的机器学习问题上具有广泛应用,并可以保证返回近似局部最小值。