无投影方差减少的随机优化
在本篇论文中,我们考虑了在强凸集上进行的优化的特殊情况。我们证明,与一般情况的收敛速度为1/t相比,vanila FW方法以1/t²的速度收敛。我们还展示了如何通过在这些集合上进行线性优化来推导FW方法的多个快速收敛结果。
Jun, 2014
探讨在线变体的Frank-Wolfe算法,包括简单迭代更新和非自适应步长规则,研究凸和非凸损失的多个新结果,并基于对随机Frank-Wolfe算法的改进分析得出在强凸随机成本时的遗憾界和任何时刻的最优性为O(log^3T/T)和O(log^2T/T) ; 此外,该在线算法即使在损失非凸的情况下也能收敛,以速率O(1/T的平方根)找到时变/随机损失的稳态点。
Oct, 2015
本文研究了Frank-Wolfe算法,提出了几个变体并分别给出了全局线性收敛性证明,证明了不同算法的收敛速度取决于几何量与条件数的乘积,这些算法在机器学习,子模优化等领域取得了实际应用。
Nov, 2015
本文研究非凸随机优化和有限和优化问题中的Frank-Wolfe方法,并提出基于方差约减技术的新型非凸Frank-Wolfe方法,证明了其具有比传统方法更快的收敛速度。
Jul, 2016
该论文提出了一种新颖的元Frank-Wolfe算法及其简化版One-Shot-Frank-Wolfe,用于对在线优化进行全局和子模最优解的快速求解。其方法基于梯度下降实现,通过随机梯度估算和孪生逼近算法来降低收敛难度。
Feb, 2018
本文介绍了一种零阶Frank-Wolfe算法,用于解决约束随机优化问题,该算法与基本Frank-Wolfe算法同样无需投影,且不需要计算梯度,可收敛于凸平滑约束下的优化目标函数。同时,本算法在具有每次迭代一个方向导数的所有零阶优化算法中具有最优维度依赖性。对于非凸函数,本算法的Frank-Wolfe gap为O(d^{1/3}T^{-1/4}),并在黑盒优化设置上进行实验,证明了其效果。
Oct, 2018
本文提出了一种称为1-SFW的新的随机Frank-Wolfe算法,通过设计一种新颖的无偏动量估计器,实现了使用每次迭代的单个样品来优化,而无需仔细调整批量大小、步长、学习速率和其他复杂的超参数,并在随机凸优化、随机DR亚模拟最大化问题和一般的非凸设置中达到了最优收敛率。
Oct, 2019
本文提出了一种加速的随机零阶Frank-Wolfe优化算法,通过使用SPIDER/SpiderBoost技术和一种新的动量加速技术,它可以在非凸优化中实现O(d√nε⁻²)的函数查询复杂度,并改进了现有最佳结果,同时在随机问题中实现了O(dε⁻³)的函数查询复杂度,同时提出了基于STORM的Acc-SZOFW *,它不需要大批量也可以达到与Acc-SZOFW相同的函数查询复杂度。
Jul, 2020
本文介绍了两种新的Frank-Wolfe算法变体,用于随机有限和最小化。这些方法在凸和非凸目标函数方面,都具有最佳的收敛保证。同时,本文提出的两种方法都不需要永久收集大批量数据和完整确定性梯度,可用于优化机器学习等领域中的结构约束问题。
Apr, 2023
该论文研究了随机受限多层优化的无投影算法。介绍了新的无投影方差缩减算法并分析了它们在不同条件下的复杂性,包括梯度映射和Frank-Wolfe间隙准则,并通过分阶段适应进一步获得了凸函数和强凸函数的复杂性,数值实验证明了该方法的有效性。
Jun, 2024