本研究提出的隐私保护算法在解决随机多臂赌博机问题时,相比之前的成果取得了较大的进展.算法可以保证最优遗憾率O(Ɛ−1+logT),通过实验证实了理论界和实践界之间的一致性。
Nov, 2015
本文提出了一种确保差分隐私的在线线性优化算法,其完全信息情况下的后果与epsilon无关,但在轮盘线性优化和非随机多臂匪徒的情况下,其遗憾上限是一个$ ilde{O}$函数,同时使时间复杂度在$\tilde{O}(\frac{1}{\epsilon}\sqrt{T}))$内。
Jan, 2017
本篇论文研究了解决上下文线性赌博机问题的隐私学习算法,其中采用联合差分隐私的定义将经典的线性-UCB算法转换成联合差分隐私算法,并在其中使用高斯噪声或Wishart噪声,使结果算法的遗憾得到了限制。此外,还给出了任何MAB问题私有算法必须产生的额外遗憾的第一个下限。
Sep, 2018
本文探讨了多臂赌博问题在本地差分隐私保证下的遗憾最小化问题,采用差分隐私技术处理用户敏感信息,证明了一种下限并提出算法,数值实验验证了结论。
Jul, 2020
本文提出了一种在随机模型下割臀膜机制下的多臂老虎机问题的差分隐私算法,其分别对应具体分布相关和分布无关两种后悔下界,并给出最优算法上界和良好的本地模型表现。
Jun, 2021
本文介绍了使用本地差分隐私的情境赌博算法,为了在保持用户数据隐私不受侵犯的情况下个性化学习,利用了一种基于随机梯度下降法的估计器和更新机制来确保使用LDP,并且在广义线性情境中利用了该方法。我们还开发了一个基于最小二乘法的评估器和更新机制,最后通过模拟和实际数据集的实验来证明了算法的性能在强隐私保护的条件下具有相当好的表现。
研究了在联邦学习中维持隐私的问题,提出了一种隐私保护的联邦组合赌博算法,P-FCB,该算法在保持敏感信息私密的同时提高了效率和减少后悔的风险。
Jun, 2022
研究了在序列决策场景中如何在保持隐私的同时提供高效用性的问题。我们提出了一种非平稳随机腐败老虎机并构建了一个叫做SW-KLUCB-CF的算法,并证明了它的效用的上界。我们提供了一种可证明最优的机制,可以在提供高效用性的同时保证期望的本地差分隐私水平。
Jan, 2023
本研究使用对数批量查询和不同的隐私模型提出不同关于武断攻击的差分隐私和鲁棒性阿姆淘汰算法,实现同时在随机线性医生问题中提供差分隐私和对手强度的功能,并提供相应的遗憾界限。
Apr, 2023
通过交互式差分隐私的视角,研究了具有可信中心决策者的隐私问题以及与之相关的bandit算法和后悔。
Sep, 2023