Feb, 2025
线性上下文赌博中的近似最优隐私学习
Near-Optimal Private Learning in Linear Contextual Bandits
TL;DR本研究解决了广义线性上下文赌博中的隐私学习问题。我们提出了一种基于重新加权回归的新方法,开发了高效的算法,达到了$\sqrt{T}+\frac{1}{\alpha}$和$\sqrt{T}/\alpha$的后悔界限。我们的结果表明,在所考虑的所有设置中,联合隐私几乎是“免费”的,部分解决了Azize和Basu(2024)提出的开放问题。