BriefGPT.xyz
Jul, 2017
汇集式赌博机中的校准公正
Calibrated Fairness in Bandits
HTML
PDF
Yang Liu, Goran Radanovic, Christos Dimitrakakis, Debmalya Mandal, David C. Parkes
TL;DR
本研究探讨在随机的多臂老虎机决策框架下的公平性问题,采用“相似个体应受到相似对待”的公平性框架,使用平滑度约束和公平性遗憾度量实现公平性,研究表明 Thompson sampling 等算法可以实现平滑公平性,且在公平性遗憾上有$ ilde{O}((kT)^{2/3})$的上界。
Abstract
We study
fairness
within the stochastic, \emph{
multi-armed bandit
} (MAB) decision making framework. We adapt the
fairness
framework of "tr
→