May, 2021

带图反馈的赌博机理解

TL;DR本文提出了分数弱支配数和最大独立集数量两个概念分别反映了图结构对 Bandit 问题的最大遗憾上限的上下界,并通过这两个概念提出了线性规划,它们各自对应于弱支配集与其对偶下的分数顶点包集,并证明了最大遗憾上限的一般上界和下界,这些界对于包括树和度数有界图在内的具有界整数间隙的图是紧密最优的。