最佳的两个世界：随机和对抗的凸函数追踪

Oct, 2023

最佳的两个世界：随机和对抗的凸函数追踪

Best of Both Worlds: Stochastic and Adversarial Convex Function Chasing

Neelkamal Bhuyan, Debankur Mukherjee, Adam Wierman

TL;DR拟凸函数追踪（CFC）是一个在线优化问题，本文研究了 CFC 问题在随机环境和对抗环境下的性能保证，并提出了一种同时在两种情况下达到性能保证的算法。

Abstract

convex function chasing (CFC) is an online optimization problem in which during each round $t$, a player plays an action $x_t$ in response to a hitting cost $f_t(x_t)$ and an additional cost of $c(x_t,x_{t-1})$ f

convex function chasing online optimization stochastic environments adversarial environments performance guarantees

发现论文，激发创造

使用预测和非凸损失的在线优化

本文提出了两个有效的充分条件来解决在线非凸优化和运动成本问题，并得出了算法 SFHC 的竞争比率，并且还为运动和击打成本提供了竞争比率结果。

Nov, 2019

追逐长期约束的凸函数

我们研究了一类带有长期约束的在线度量问题，该问题涉及在线玩家在度量空间中进行决策以同时最小化击中成本和度量确定的切换成本。我们设计了特定实例的最优竞争性和学习增强算法，并进一步在数值实验中证明了我们提出的算法的良好性能。

Feb, 2024

具有对抗约束的在线凸优化的严格界

有关在线凸优化和约束在线凸优化的一篇研究论文，证明了一个在线策略可以同时实现 O (√T) 的遗憾和 θ̃(√T) 的累积约束违规，通过将 AdaGrad 算法的自适应遗憾界与 Lyapunov 优化相结合，达到了这一结果。

May, 2024

黑暗中的游戏：带有对抗性约束的无悔学习

我们研究了经典的在线凸优化（OCO）框架的一种推广，通过考虑额外的长期对抗性约束。我们提出了一种元策略，能够同时达到亚线性的累积约束违规和亚线性的遗憾，通过将约束问题转化为递归构建的一系列代理代价函数的标准 OCO 问题的黑盒减缩。我们展示了通过使用任何享有标准数据相关遗憾上界的自适应 OCO 策略求解代理问题，可以达到最优性能界限。通过一种新的基于李雅普诺夫的证明技术，我们揭示了遗憾和某些顺序不等式之间的联系，通过一种新颖的分解结果。最后，我们强调了在在线多任务学习和网络控制问题中的应用。

Oct, 2023

在线随机凸规划的快速算法

本文介绍了在线随机凸规划问题，提出了针对此问题的快速算法，并在这些算法中使用了原始对偶算法，实现了最优竞争比率和接近最优的后悔保证。

Oct, 2014

非光滑弱凸有限和耦合组合优化

本文研究的是具有新族类的组合优化问题，即非光滑弱凸有限和耦合组合优化问题 (NSWC FCCO)。我们通过研究非光滑弱凸的 FCCO 问题对现有研究进行了拓展，并进一步扩展了算法解决新型非光滑弱凸三层有限和耦合组合优化问题，并通过实证研究展示了算法的有效性。

Oct, 2023

随机约束下的在线凸优化

本文研究带随机约束的在线凸优化问题，提出了一种算法，能够达到预期和高概率的收益掉队和约束违反值等性能保证，并在真实数据中心调度问题上进行了实验验证。

Aug, 2017

最优地追逐凸体

本文提出了一种改进的算法来解决凸体追逐问题，实现了广义范数空间上的常数竞争比，而在欧几里得空间中，我们的算法同时还实现了接近于研究数量函数的 Steiner 点的最佳竞争比 O (根号 dlogN)。

May, 2019

线性上下文强化学习的最佳算法

我们研究了针对 K 臂线性情境赌博机的最佳算法，无需先前对环境有所了解，在敌对和随机的情境下都能够提供接近最优的后悔边界。

Dec, 2023

医生对口罩使用的结论：有用但需辩证看待

本研究提出了一种广义的最好结果算法以及如何通过规范化导向跟随和在线镜像下降算法实现在线学习中的最好结果，将这种算法应用于上下文、图和表马尔科夫决策过程中。

Feb, 2023