Feb, 2024

随机赌博机中同时实现群体曝光公平和组内精英主义

TL;DR深入研究了公平性,提出了一种基于两个层次的公平性方法,保证每个组的最小曝光,并确保组内每个单元根据其优越性被拉动;通过提出的算法 BF-UCB,实现了对遗憾的上界为 O(√T) 的平衡,同时提供更好的组和个体曝光保证,并且不会显著降低奖励。