Feb, 2024
学习严格凸形随机合作博弈的预期核心
Learning the Expected Core of Strictly Convex Stochastic Cooperative
Games
TL;DR在本文中,我们考虑了随机合作博弈的稳定分配学习问题,在这个问题中,奖励函数被描述为具有未知分布的随机变量。我们提出了一个名为“Common-Points-Picking”的算法,它在多项式数量的样本下,以很高的概率返回一个稳定的分配。我们的算法分析涉及了凸几何学中的一些新结果,包括多个凸集合分离超平面定理的扩展,可能具有独立的研究价值。