mirror descent | BriefGPT - AI 论文速递

关键词mirror descent

搜索结果 - 42

在 Wasserstein 空间中的镜像和预处理梯度下降
通过在 Wasserstein 空间上引入测度梯度的离散时间方案，证明了一些目标函数和正则化器的收敛性，同时展示了在计算生物学中选择不同的差异度和几何结构的优势。
PDF21 days ago
ICML可配置镜像下降：决策制定的统一化
这篇论文旨在探索是否能开发一种单一算法以解决所有决策问题的分类。它通过引入广义镜像下降（GMD）、可配置镜像下降（CMD）和 GameBench 构建等方法来应对不同决策问题的挑战，并通过广泛的实验验证 CMD 在各个维度上对决策问题进行了
PDFa month ago
稳定相位恢复与镜像下降
在本文中，我们旨在从受加性噪声污染的 m 个无相位测量中重构一个 n 维实向量。我们扩展了基于镜像下降（或 Bregman 梯度下降）的无噪声框架，以处理噪声测量，并证明该过程对（足够小的）加性噪声是稳定的。在确定性情况下，我们证明了镜像下
PDF2 months ago
Sinkhorn Flow: Sinkhorn 算法的连续时间框架解读与推广
机器学习中的熵正则最优传输问题可以通过 Sinkhorn 算法进行求解，而该研究介绍了 Sinkhorn 算法的连续时间模拟以及其在噪声和偏差容忍性方面的改进，同时与机器学习和数学领域中其他动态方法提供了统一的视角。
PDF7 months ago
自适应镜像下降双层优化
我们提出了一类基于镜像下降的高效自适应双层优化方法，用于求解非凸双层优化问题，其中上层问题可能是非凸的且具有非光滑正则化，而下层问题也是非凸的但满足 Polyak-Lojasiewicz 条件。我们提出了一种基于镜像下降的高效自适应投影梯度
PDF8 months ago
通过凸松弛求解图匹配问题
本文介绍了一种应对图匹配问题的新型凸松弛算法，通过闭合迭代的镜像下降方案，实现了在相关高斯维格纳模型下对应的唯一解高概率收敛，进一步确立了输入矩阵的新充要条件，并将其应用于噪声下的地面实况恢复中。
PDF8 months ago
马尔可夫链镜像下降在数据联合中的应用
该研究提出了一种名为 MarchOn 的随机镜像下降的新版本，应用于联合学习的场景，通过分析该方法的新框架，获得了凸性、强凸性和非凸性损失函数的最佳收敛速度，最后通过实证研究验证了理论结果。
PDF9 months ago
使用镜像下降与共轭梯度的高效准确最优输运
我们设计了一种新的算法来计算最优运输成本，该算法结合了熵最优运输、镜像下降和共轭梯度文献，能够高效地在 GPU 上实现，表现出更快的迭代收敛速度，并能适应高熵边际分布的复杂优化问题，我们在 MNIST 数据集上进行了实验，结果显示该算法是实
PDFa year ago
镜像下降统一控制隐式正则化方法
本文使用镜像下降方法来解决深度神经网络优化算法中的隐含正则化问题。
PDFa year ago
突触重量分布取决于可塑性的几何形状
本研究通过理论工具，展示由于突触可塑性几何形状的影响，梯度下降假设的欧几里德几何距离可能被认为是错误的，呈现了突触重量分布的实验结论与标准梯度下降算法不一致的存在，并提出了实验证据可以用于评价不同突触几何形状假设的可行性。
PDFa year ago
通用优化方法的更快边缘最大化率
本文介绍了一种将常规优化算法转化为在线学习动态的方法，以解决具有多个局部极小值的给定训练目标的最小化，通过在线学习算法的遗憾界来获得隐式偏差率，并比较了梯度下降、镜像下降和最陡下降这三种不同的优化算法的隐式偏差率。
PDFa year ago
ICMLBregman--Moreau 包络下的 Bregman 近端 Langevin Monte Carlo
该研究提出了基于 Langevin Monte Carlo 的高效采样算法，针对由连续可微函数和非光滑函数组成的凸结合势函数进行采样。该算法利用了凸分析和优化方法中 Bregman 散度的最新进展，并将 Langevin Monte Car
PDF2 years ago
梯度下降对重新参数化模型的隐式偏差及其与镜像下降的等价性
本文讨论梯度下降算法中超参数模型中的隐含偏差问题，将超参数模型下的训练轨迹视为不同目标函数上的镜像下降，对该现象在 commuting parametrization 条件下进行了表征，证明了任何 commuting parametriza
PDF2 years ago
广义数据上，具有二次限制的随机线性优化从不过拟合
本文针对线性预测器的迭代定点方法（特别是随机和批量镜像下降法及随机时间差分学习），提供了测试误差界限。主要贡献包括：通过单一证明技巧对收敛和非收敛状态下具有高概率保证的拟合损失进行统一处理，以无需投影、正则化或任何等效手段，适用于具有二次界
PDF2 years ago
ICLRBregman 梯度策略优化
本文提出了一种基于 Bregman 距离和动量技术的强化学习的 Bregman 梯度策略优化框架，通过基本动量技术和镜像下降迭代提出 Bregman 梯度策略优化（BGPO）算法，同时进一步提出基于方差降低技术的加速 Bregman 梯度策
PDF3 years ago
AAAI序贯决策和广义博弈的赌徒线性优化
报告描述了如何设计面向 TFSDM 的探索 - 利用算法以解决困难的在线决策问题
PDF3 years ago
镜像下降和信息比率
本论文研究了镜像下降法和信息比率之间的关系，探讨了在采样信息导向时，采用合适的损失估计器和探索分布的镜像下降法和信息导向采样的贝叶斯后验遗憾上限呈现相同的下降趋势，并且本文还提供了一种有效的算法用于敌对赌博问题中，该算法的遗憾上限与信息理论
PDF4 years ago
ICML通过连续的函数梯度优化引导非凸模型学习
本文提出了一种适用于训练非凸模型（如神经网络）的连续函数梯度优化框架，其中使用了函数空间镜像下降法驱动训练。我们对该训练方法进行了理论分析和实证研究，并证明该方法比传统训练技术具有更好的性能。
PDF4 years ago
镜像下降策略优化
提出了一种称为镜像下降策略优化（Mirror Descent Policy Optimization，MDPO）的高效强化学习算法，MDPO 是一个迭代更新策略的算法，其目标函数由标准强化学习目标的线性化和一个限制连续策略之间接近的接近项组
PDF4 years ago
ICLR神经架构搜索的几何感知梯度算法
本文研究神经架构搜索中的优化问题，提出一种基于单层经验风险最小化的几何感知框架，结合梯度下降和正则化的优化器，通过基于连续优化的松弛方法实现对离散寻找空间的搜索，成功为计算机视觉中的最新 NAS 基准提供了一种优异的算法。
PDF4 years ago