带有赌徒反馈的最小化最大化子模优化

Oct, 2023

带有赌徒反馈的最小化最大化子模优化

Minimax Optimal Submodular Optimization with Bandit Feedback

Artin Tajdini, Lalit Jain, Kevin Jamieson

TL;DR利用随机bandit反馈在无序集合函数最大化问题中建立了首个极小极大下界，并提出了一个能够匹配下界的算法。

Abstract

We consider maximizing a monotonic, submodular set function $f: 2^{[n]} \rightarrow [0,1]$ under stochastic bandit feedback. Specifically, $f$ is unknown to the learner but at each time $t=1,\dots,T$ the learner chooses a set $S_t \subset [n]$ with $|S_t| \leq k$ and receives reward $f