Jul, 2017

汇集式赌博机中的校准公正

TL;DR本研究探讨在随机的多臂老虎机决策框架下的公平性问题,采用“相似个体应受到相似对待”的公平性框架,使用平滑度约束和公平性遗憾度量实现公平性,研究表明 Thompson sampling 等算法可以实现平滑公平性,且在公平性遗憾上有$ ilde{O}((kT)^{2/3})$的上界。