鲁棒和差分隐私随机线性赌博机

Apr, 2023

Robust and differentially private stochastic linear bandits

Vasileios Charisopoulos, Hossein Esfandiari, Vahab Mirrokni

TL;DR本研究使用对数批量查询和不同的隐私模型提出不同关于武断攻击的差分隐私和鲁棒性阿姆淘汰算法，实现同时在随机线性医生问题中提供差分隐私和对手强度的功能，并提供相应的遗憾界限。

Abstract

In this paper, we study the stochastic linear bandit problem under the additional requirements of differential privacy, robustness and

发现论文，激发创造

差分隐私多臂赌博机算法

本研究提出的隐私保护算法在解决随机多臂赌博机问题时,相比之前的成果取得了较大的进展.算法可以保证最优遗憾率O(Ɛ−1+logT),通过实验证实了理论界和实践界之间的一致性。

Nov, 2015

在线学习的差分隐私代价

本文提出了一种确保差分隐私的在线线性优化算法，其完全信息情况下的后果与epsilon无关，但在轮盘线性优化和非随机多臂匪徒的情况下，其遗憾上限是一个$ ilde{O}$函数，同时使时间复杂度在$\tilde{O}(\frac{1}{\epsilon}\sqrt{T}))$内。

Jan, 2017

差分隐私上下文线性赌博机

本篇论文研究了解决上下文线性赌博机问题的隐私学习算法，其中采用联合差分隐私的定义将经典的线性-UCB算法转换成联合差分隐私算法，并在其中使用高斯噪声或Wishart噪声，使结果算法的遗憾得到了限制。此外，还给出了任何MAB问题私有算法必须产生的额外遗憾的第一个下限。

Sep, 2018

(局部) 差分隐私组合半匪帮算法

本文研究了具有差分隐私和强局部差分隐私的组合半臂赌博问题，证明了在常见平滑性假设下，该算法可以消除额外的依赖于数据维度的副作用，并且获得了最优的损失界限，表明在这些普遍的设置下，组合半臂赌博的方法没有额外的价格。

Jun, 2020

具有本地差分隐私的多臂赌博机

本文探讨了多臂赌博问题在本地差分隐私保证下的遗憾最小化问题，采用差分隐私技术处理用户敏感信息，证明了一种下限并提出算法，数值实验验证了结论。

Jul, 2020

抗对抗攻击的随机线性臂机算法

研究了随机线性赌博机问题，考虑了对抗攻击，提出了两种Robust Phased Elimination算法，证明了在非污染情况下可以获得近似最优的收益，并得出针对这些算法的相对近似最优的加性项。同时，在具有多样化情境的情况下，表明一种简单的贪婪算法是稳健的，近似最优的加性遗憾项，尽管不进行明确的探索并且不知道C。

Jul, 2020

具有本地差分隐私的广义线性赌博机

本文介绍了使用本地差分隐私的情境赌博算法，为了在保持用户数据隐私不受侵犯的情况下个性化学习，利用了一种基于随机梯度下降法的估计器和更新机制来确保使用LDP，并且在广义线性情境中利用了该方法。我们还开发了一个基于最小二乘法的评估器和更新机制，最后通过模拟和实际数据集的实验来证明了算法的性能在强隐私保护的条件下具有相当好的表现。

Jun, 2021

在动态环境下的序列决策中使用本地差分隐私

研究了在序列决策场景中如何在保持隐私的同时提供高效用性的问题。我们提出了一种非平稳随机腐败老虎机并构建了一个叫做SW-KLUCB-CF的算法，并证明了它的效用的上界。我们提供了一种可证明最优的机制，可以在提供高效用性的同时保证期望的本地差分隐私水平。

Jan, 2023

私人和强健赌博机

研究私有和强健的多臂赌博机，提出了一种私密且强健的平均估计子例程，基于奖励截断和拉普拉斯机制，旨在实现评估精度、隐私和鲁棒性三者之间的最佳平衡。

Feb, 2023

差分隐私高维赌博机

我们考虑高维度的随机情景线性赌博问题，在参数向量是$s_{0}$-稀疏的情况下，决策者受到差分隐私在中心模型和本地模型下的约束。我们提出了PrivateLASSO，一种差分隐私的LASSO赌博算法，它基于两个子例程：(i)基于稀疏硬阈值的隐私机制和(ii)用于识别参数$ heta$支撑集的时序阈值规则。我们证明了最小化差分隐私的下界，并在标准假设下为PrivateLASSO在中心模型下建立了隐私和效用保证。

Feb, 2024