互动和集中的差分隐私对于赌博机

Sep, 2023

互动和集中的差分隐私对于赌博机

Interactive and Concentrated Differential Privacy for Bandits

Achraf Azize, Debabrota Basu

TL;DR通过交互式差分隐私的视角，研究了具有可信中心决策者的隐私问题以及与之相关的bandit算法和后悔。

Abstract

bandits play a crucial role in interactive learning schemes and modern recommender systems. However, these systems often rely on sensitive user data, making privacy a critical concern. This paper investigates

发现论文，激发创造

差分隐私多臂赌博机算法

本研究提出的隐私保护算法在解决随机多臂赌博机问题时,相比之前的成果取得了较大的进展.算法可以保证最优遗憾率O(Ɛ−1+logT),通过实验证实了理论界和实践界之间的一致性。

Nov, 2015

在线学习的差分隐私代价

本文提出了一种确保差分隐私的在线线性优化算法，其完全信息情况下的后果与epsilon无关，但在轮盘线性优化和非随机多臂匪徒的情况下，其遗憾上限是一个$ ilde{O}$函数，同时使时间复杂度在$\tilde{O}(\frac{1}{\epsilon}\sqrt{T}))$内。

Jan, 2017

差分隐私上下文线性赌博机

本篇论文研究了解决上下文线性赌博机问题的隐私学习算法，其中采用联合差分隐私的定义将经典的线性-UCB算法转换成联合差分隐私算法，并在其中使用高斯噪声或Wishart噪声，使结果算法的遗憾得到了限制。此外，还给出了任何MAB问题私有算法必须产生的额外遗憾的第一个下限。

Sep, 2018

(局部) 差分隐私组合半匪帮算法

本文研究了具有差分隐私和强局部差分隐私的组合半臂赌博问题，证明了在常见平滑性假设下，该算法可以消除额外的依赖于数据维度的副作用，并且获得了最优的损失界限，表明在这些普遍的设置下，组合半臂赌博的方法没有额外的价格。

Jun, 2020

具有本地差分隐私的多臂赌博机

本文探讨了多臂赌博问题在本地差分隐私保证下的遗憾最小化问题，采用差分隐私技术处理用户敏感信息，证明了一种下限并提出算法，数值实验验证了结论。

Jul, 2020

具有本地差分隐私的广义线性赌博机

本文介绍了使用本地差分隐私的情境赌博算法，为了在保持用户数据隐私不受侵犯的情况下个性化学习，利用了一种基于随机梯度下降法的估计器和更新机制来确保使用LDP，并且在广义线性情境中利用了该方法。我们还开发了一个基于最小二乘法的评估器和更新机制，最后通过模拟和实际数据集的实验来证明了算法的性能在强隐私保护的条件下具有相当好的表现。

Jun, 2021

在动态环境下的序列决策中使用本地差分隐私

研究了在序列决策场景中如何在保持隐私的同时提供高效用性的问题。我们提出了一种非平稳随机腐败老虎机并构建了一个叫做SW-KLUCB-CF的算法，并证明了它的效用的上界。我们提供了一种可证明最优的机制，可以在提供高效用性的同时保证期望的本地差分隐私水平。

Jan, 2023

鲁棒和差分隐私随机线性赌博机

本研究使用对数批量查询和不同的隐私模型提出不同关于武断攻击的差分隐私和鲁棒性阿姆淘汰算法，实现同时在随机线性医生问题中提供差分隐私和对手强度的功能，并提供相应的遗憾界限。

Apr, 2023

DP-Dueling：从偏好反馈学习而不损害用户隐私

在差分隐私的约束下，我们提出了一种首个能够保护用户偏好的活跃学习的差分隐私决策竞争算法，具有接近最优性能的高效计算能力与遗憾边界。

Mar, 2024

关于局部隐私线性情境赌博机的最佳后悔

通过分析均值绝对偏差误差和分层主成分回归，我们展示了一种能够在局部隐私线性情境播放机中实现 O(√T) 累积遗憾上界的解决方案。

Apr, 2024