无悔的 M${}^{atural}$ 凹函数最大化：随机赌博算法和对抗完全信息设置的 NP 困难性

May, 2024

无悔的 M${}^{atural}$ 凹函数最大化：随机赌博算法和对抗完全信息设置的 NP 困难性

No-Regret M${}^{\natural}$-Concave Function Maximization: Stochastic Bandit Algorithms and NP-Hardness of Adversarial Full-Information Setting

PDF

Taihei Oki, Shinsaku Sakaue

TL;DR基于反馈的交互式最大化在线 M${}^{atural}$- 凹函数研究中，我们提出了 $O (T^{-1/2})$-simple regret 和 $O (T^{2/3})$-regret 算法，证明了贪心算法对于 M${}^{atural}$- 凹函数最大化中的局部误差的鲁棒性，并对于多项式时间每回合运行算法无法实现 $O (T^{1-c})$ regret 的可能性给出了证明。

Abstract

M${}^{\natural}$-concave functions, a.k.a. gross substitute valuation functions, play a fundamental role in many fields, including discrete mathematics and economics. In practice, perfect knowledge of M${}^{\natural}$-concave functions is often unavailable a priori, and we can optimize them only interactively based on some feedback. Motivated by such situati

m${}^{ atural}$-concave functions interactive optimization stochastic bandit setting simple regret adversarial setting

发现论文，激发创造

求和最大子模函数博弈

在线决策问题、子模函数、求和 - 最大函数、强化学习以及后悔上界是该研究论文的主要关键词和内容。

Nov, 2023

在线连续子模最大化

本文研究一种在线优化过程，其中目标函数不是凸函数（也不是凹函数），而是属于广泛的连续次模函数类。我们提出了一种 Frank-Wolfe 算法的变体，它可以访问目标函数的全梯度，并证明它对未来最佳可行解的（1-1/e）- 近似具有 O（T 的平方根）的遗憾界。对于只能获得梯度的无偏估计的情况，我们还提出了在线随机梯度上升算法，并证明它也具有 O（T 的平方根）的遗憾界，但只能对未来最佳可行解的 1/2 的近似度。我们还将结果推广到 γ- 弱次模函数，并证明相同的次线性遗憾界。最后，在几个问题实例上演示了算法的效率，包括非凸 / 非凹二次规划，子模集函数的多线性扩展和 D - 最佳设计。

Feb, 2018

带有赌徒反馈的最小化最大化子模优化

利用随机 bandit 反馈在无序集合函数最大化问题中建立了首个极小极大下界，并提出了一个能够匹配下界的算法。

Oct, 2023

带有强盗反馈的随机凸优化

本文提出了一种基于随机赌博反馈模型的新型优化算法，采用椭球算法的泛化形式，对凸紧致集上的凸利普希茨（Lipschitz）函数最小化问题进行求解，证明其性能在满足一定条件下与时间步数 T 为 O（d^3/2）同阶，并获得了泛化性能的高阶乘性加速，表现出良好的应用前景和性能优势。

Jul, 2011

在线连续子模最大化：从完全信息到 Bandit 反馈

本文提出了三种在线算法，分别用于子模最大化问题中的函数渐变计算优化、带赌博的子模最大化问题和响应式带乘积集约束的带乘积子模问题。三个算法在达到 $(1-1/e)$ -regret bound 的前提下，分别取得了复杂度为 $O (T^{4/5})$、$O (T^{8/9})$ 以及 $O (T^{8/9})$ 的折损。

Oct, 2019

公平多智体社会福利优化的无懊悔学习

在线多智能体 NSW（Nash 社会福利）最大化问题中，我们提出了一种完全回答 NSW 作为目标的无悔公平学习是否可能的算法，并且在不同设置下得到了相应的后悔界限。

May, 2024

针对零阶对抗性 Bandit 凸优化的改进遗憾

以信息论为基础，改进探索性分布以在零阶对抗性 bandit 凸优化的 minimax regret 的信息理论上界上证明其为 O (d^{2.5} 根号 n 对数 (n))，并提高 Bubeck 等人 (2017) 的 O (d^{9.5} 根号 n 对数 (n)^{7.5} 上界。

May, 2020

无遗憾并不足够！通过自适应遗憾最小化处理具有一般约束的赌博机

通过要求原始算法和对偶算法是弱自适应的，我们证明了在「背包带劫匪」框架中，能够保证子线性的对违规约束的罚值，并同时在随机和对抗的情况下提供最佳性能，并为具有线性约束的上下文劫匪问题提供了首个无 α- 遗憾的保证。

May, 2024

探讨赌博机和无导数随机凸优化的复杂性

本文探讨了在带有巴氏反馈或者没有梯度知识下的凸随机优化问题。我们通过精确表征强凸平滑函数的性能以及非凸平滑函数的性能下界，证明了在这两种情况下，所需的查询次数至少要实现二次比例尺度关系。我们同时还发现对于二次函数，即使在没有梯度信息的情况下，也可以在平方次的询问内实现 O (1/T) 的误差率。此结果是在派生式随机情况下的首次结果，并且在之前暗示相反的情况下，依然成立。

Sep, 2012

具有单调性约束的安全贝叶斯优化的无懊悔算法

我们研究如何在未知安全函数约束下，顺序最大化未知函数的问题，并提出了一种算法来实现亚线性遗憾的搜索

Jun, 2024