Dec, 2023

通过高阶导数总结将牛顿法应用于神经网络

TL;DR本研究论文介绍了一种基于梯度的优化方法,并提出了一个计算上廉价的技术,用于获得有关张量之间交互关系的二阶信息。使用这种技术,构建了适用于各种深度神经网络结构的二阶优化方法,避免了计算 Hessian 矩阵和其近似的复杂性,并改善了现有的对角线或块对角线近似方法。