混洗模型下的差分隐私多臂老虎机

Jun, 2021

混洗模型下的差分隐私多臂老虎机

Differentially Private Multi-Armed Bandits in the Shuffle Model

Jay Tenenbaum, Haim Kaplan, Yishay Mansour, Uri Stemmer

TL;DR本文提出了一种在随机模型下割臀膜机制下的多臂老虎机问题的差分隐私算法，其分别对应具体分布相关和分布无关两种后悔下界，并给出最优算法上界和良好的本地模型表现。

Abstract

We give an $(\varepsilon,\delta)$-differentially private algorithm for the multi-armed bandit (MAB) problem in the shuffle model with a distribution-dependent regret of $O\left(\left(\sum_{a\in [k]:\Delta_a>0}\fr