Jul, 2017

汇集式赌博机中的校准公正

TL;DR本研究探讨在随机的多臂老虎机决策框架下的公平性问题,采用 “相似个体应受到相似对待” 的公平性框架,使用平滑度约束和公平性遗憾度量实现公平性,研究表明 Thompson sampling 等算法可以实现平滑公平性,且在公平性遗憾上有 $ ilde {O}((kT)^{2/3})$ 的上界。