鲁棒和差分隐私随机线性赌博机
本研究提出的隐私保护算法在解决随机多臂赌博机问题时,相比之前的成果取得了较大的进展.算法可以保证最优遗憾率O(Ɛ−1+logT),通过实验证实了理论界和实践界之间的一致性。
Nov, 2015
本文提出了一种确保差分隐私的在线线性优化算法,其完全信息情况下的后果与epsilon无关,但在轮盘线性优化和非随机多臂匪徒的情况下,其遗憾上限是一个$ ilde{O}$函数,同时使时间复杂度在$\tilde{O}(\frac{1}{\epsilon}\sqrt{T}))$内。
Jan, 2017
本篇论文研究了解决上下文线性赌博机问题的隐私学习算法,其中采用联合差分隐私的定义将经典的线性-UCB算法转换成联合差分隐私算法,并在其中使用高斯噪声或Wishart噪声,使结果算法的遗憾得到了限制。此外,还给出了任何MAB问题私有算法必须产生的额外遗憾的第一个下限。
Sep, 2018
本文研究了具有差分隐私和强局部差分隐私的组合半臂赌博问题,证明了在常见平滑性假设下,该算法可以消除额外的依赖于数据维度的副作用,并且获得了最优的损失界限,表明在这些普遍的设置下,组合半臂赌博的方法没有额外的价格。
Jun, 2020
研究了随机线性赌博机问题,考虑了对抗攻击,提出了两种Robust Phased Elimination算法,证明了在非污染情况下可以获得近似最优的收益,并得出针对这些算法的相对近似最优的加性项。同时,在具有多样化情境的情况下,表明一种简单的贪婪算法是稳健的,近似最优的加性遗憾项,尽管不进行明确的探索并且不知道C。
Jul, 2020
本文介绍了使用本地差分隐私的情境赌博算法,为了在保持用户数据隐私不受侵犯的情况下个性化学习,利用了一种基于随机梯度下降法的估计器和更新机制来确保使用LDP,并且在广义线性情境中利用了该方法。我们还开发了一个基于最小二乘法的评估器和更新机制,最后通过模拟和实际数据集的实验来证明了算法的性能在强隐私保护的条件下具有相当好的表现。
Jun, 2021
研究了在序列决策场景中如何在保持隐私的同时提供高效用性的问题。我们提出了一种非平稳随机腐败老虎机并构建了一个叫做SW-KLUCB-CF的算法,并证明了它的效用的上界。我们提供了一种可证明最优的机制,可以在提供高效用性的同时保证期望的本地差分隐私水平。
Jan, 2023
我们考虑高维度的随机情景线性赌博问题,在参数向量是$s_{0}$-稀疏的情况下,决策者受到差分隐私在中心模型和本地模型下的约束。我们提出了PrivateLASSO,一种差分隐私的LASSO赌博算法,它基于两个子例程:(i)基于稀疏硬阈值的隐私机制和(ii)用于识别参数$ heta$支撑集的时序阈值规则。我们证明了最小化差分隐私的下界,并在标准假设下为PrivateLASSO在中心模型下建立了隐私和效用保证。
Feb, 2024