Oct, 2022

学习优化拟牛顿方法

TL;DR本文提出了一种新的机器学习优化器LODO,它将学习优化(L2O)技术与拟牛顿方法相结合,用于学习对称矩阵向量积的神经表示,从而适应于在测试任务中遍历的损失景观的局部特征。与其他L2O方法不同的是,我们的方法不需要在训练任务分布上进行任何元训练,并验证了其在噪声中的表现,并证明其能够表示一种广泛的逆Hessian。实验表明,简单的替代方法会导致性能变差。最后,我们使用我们的优化器训练一个拥有95k参数的半真实深度神经网络,并获得了与标准神经网络优化器竞争的结果。