梯度下降优化在流形上的平凡化

Sep, 2019

Trivializations for Gradient-Based Optimization on Manifolds

Mario Lezcano-Casado

TL;DR通过参数化的欧几里得空间，我们引入了一个框架来研究如何将具有多重约束的问题转化为无约束问题。在此基础上，我们提出了动态平凡化的两个族群，这些最优化方法介于平凡化和黎曼梯度下降之间，并结合了两者的优点。最后，我们展示了动态平凡化如何提高现有方法在测试神经网络中的长期记忆方面的性能。

Abstract

We introduce a framework to study the transformation of problems with manifold constraints into unconstrained problems through parametrizations in terms of a Euclidean space. We call these parametrizations "trivializations". We prove conditions under which a trivialization is sound in

发现论文，激发创造

黎曼流形上的随机梯度下降

本文介绍了一种扩展随机梯度下降算法来优化在Riemannian流形上定义的代价函数的方法，并通过四个例子展示了其潜在的应用，其中包括派生和数字测试的一种新型的协方差矩阵的聚集算法。

Nov, 2011

固定秩矩阵分解与黎曼低秩优化

采用Riemannian余维度流形上的优化几何方法及其梯度下降和信任区域算法，对学习大型固定秩非对称矩阵的线性回归模型进行了研究，推广了固定秩对称正定矩阵的一般结果，可用于机器学习算法的设计，数值实验表明，与现有算法竞争并提供了一种有效且灵活的算法，用于学习固定秩矩阵。

Sep, 2012

一个用于半正定矩阵块对角约束优化的Riemannian低秩方法

提出了一种新的算法来解决优化问题，该算法针对平滑函数和受限X的正半定和对角块小标识矩阵的约束。该算法利用该问题的低秩解和黎曼流形上的光滑优化问题的秩约束版本的事实，并比较该算法与成熟软件的优势。

Jun, 2015

黎曼自适应优化方法

将Adam、Adagrad和Amsgrad等流行的自适应随机优化方法扩展到里曼流形上面的困难以及基于里曼流形的优化算法和渐进结果的提出，同时在实验中证明该算法比原算法更快且表现更好。

Oct, 2018

矩阵流形上的黎曼适应性随机梯度算法

该研究提出了一种针对Riemannian矩阵流形的新型随机梯度算法，通过适应梯度的行和列子空间，使算法能够在保留流形丰富结构的同时进行优化，并证明了算法的收敛性和收敛速率。

Feb, 2019

过参数非线性系统和神经网络中的损失景观和优化

本文提出了一种现代观点和一般性的数学框架，用于涵盖超参数机器学习模型和非线性方程组的损失景观和高效优化，其中包括超参数深度神经网络，并说明这些系统的PL$^*$条件密切相关，这解释了（S）GD对全局最小值的收敛，并提出了一个放松PL$^*$条件的方法可应用于几乎超参数系统。

Feb, 2020

可行的结构化自然梯度下降使用本地参数化

本文介绍了使用本地参数坐标的自然梯度下降法及其在协方差参数化中的应用，为深度学习、变分推断和进化策略等问题的可伸缩结构几何方法开辟了新方向。

Feb, 2021

通过黎曼收缩在监督学习中的泛化能力

本文证明了监督学习中的黎曼收缩会导致泛化，对于凸性和非凸性的损失表面，在确定性和随机优化中，如果优化器在某种黎曼度量模下的缩小速率为λ>0，则它的均匀算法稳定性速率为O(1/λn)（其中n是训练集中的有标签示例数），相关的泛化界在某些线性设置中是最优的。

Jan, 2022

RSAM：使用黎曼尖锐感知最小化的流形学习

将尖锐感最小化(SAM)优化器推广到黎曼流形中，通过融合几何原理于优化中，增强模型的鲁棒性和泛化能力。

Sep, 2023

矩阵流形上的Riemannian坐标下降算法

提出了在矩阵流形上开发计算效率高的坐标下降（CD）算法的一般框架，从而允许在每次迭代中仅更新少数变量，并符合流形约束。通过一阶目标函数的近似实现了更高效的变体，分析了它们的收敛性和复杂性，并在多个应用中验证了它们的有效性。

Jun, 2024