Aug, 2023

安全线性赌臂机中的问题几何利用

TL;DR通过利用特定问题设置的几何性质,我们为分离良好的问题实例和有限星凸集的行动集提供了改进的遗憾保证。此外,我们提出了一种新的算法,该算法在选择问题参数时自适应,并且至少与现有算法具有相同的遗憾保证。最后,我们引入了安全线性贝叶斯设定的一个概括,其中约束是凸的,并通过一种基于凸分析的方法利用我们的算法和分析。模拟结果显示在各种随机抽样的设置中相对于现有算法的性能有所提升。