差分隐私多臂赌博机算法

Nov, 2015

Algorithms for Differentially Private Multi-Armed Bandits

Aristide Tossou, Christos Dimitrakakis

TL;DR本研究提出的隐私保护算法在解决随机多臂赌博机问题时,相比之前的成果取得了较大的进展.算法可以保证最优遗憾率O(Ɛ−1+logT),通过实验证实了理论界和实践界之间的一致性。

Abstract

We present differentially private algorithms for the stochastic Multi-Armed Bandit (MAB) problem. This is a problem for applications such as adaptive clinical trials, →