互动和集中的差分隐私对于赌博机
本文研究联邦线性情境强化学习在用户级差分隐私下的模型,介绍了用户级中心差分隐私和本地差分隐私,并研究了学习遗憾与相应差分隐私保证之间的基本权衡。对于中心差分隐私,提出了一种联邦算法 Robin,并在满足用户级差分隐私的情况下证明了其近乎最优,对于本地差分隐私,获得了一些下界,表明在不同条件下,满足用户级 (ε,δ)-LDP 的学习必须遭受至少 min {1/ε,M} 或 min {1 / 根号下 ε,根号下 M} 的遗憾膨胀因子。
Jun, 2023
在差分隐私的约束下,我们提出了一种首个能够保护用户偏好的活跃学习的差分隐私决策竞争算法,具有接近最优性能的高效计算能力与遗憾边界。
Mar, 2024
本文研究局部差分隐私策略下的赌博机学习。我们提出了一种简单的黑盒归约框架,可以解决大量的无上下文赌博机学习问题,同时保证局部差分隐私。这个框架在真实应用中更具吸引力。此外,我们将其扩展到广义线性赌博机,并推测它是近乎最优的。
Jun, 2020
本文介绍了使用本地差分隐私的情境赌博算法,为了在保持用户数据隐私不受侵犯的情况下个性化学习,利用了一种基于随机梯度下降法的估计器和更新机制来确保使用 LDP,并且在广义线性情境中利用了该方法。我们还开发了一个基于最小二乘法的评估器和更新机制,最后通过模拟和实际数据集的实验来证明了算法的性能在强隐私保护的条件下具有相当好的表现。
Jun, 2021
本研究提出一种基于差分隐私约束条件的在线探索强化学习算法,该算法达到了非隐私算法的信息理论下限,同时利用隐私发布噪音技术获得了隐私保护,解决了个性化医疗等隐私数据应用中数据使用安全的问题。
Dec, 2022
本文探讨了结合差分隐私和多智能体赌博学习的联邦私有赌博机制。我们研究了如何将基于差分隐私的置信上界方法应用于多智能体环境,特别是应用于主 - 从和完全分散的联邦学习环境中,并提供了有关所提出方法的隐私和后悔性能的理论分析,并探讨了这两者之间的权衡。
May, 2020
本文研究了具有差分隐私和强局部差分隐私的组合半臂赌博问题,证明了在常见平滑性假设下,该算法可以消除额外的依赖于数据维度的副作用,并且获得了最优的损失界限,表明在这些普遍的设置下,组合半臂赌博的方法没有额外的价格。
Jun, 2020
我们研究了具有差分隐私约束的多智能体强化学习问题,设计了一种基于乐观纳什值迭代和 Bernstein 型奖励的算法,能满足 JDP 和 LDP 的要求,并提供了关于后悔界的推广结果,是对多智能体强化学习中轨迹隐私保护的首批研究。
Apr, 2024
本研究提出的隐私保护算法在解决随机多臂赌博机问题时,相比之前的成果取得了较大的进展。算法可以保证最优遗憾率 O (Ɛ−1+logT), 通过实验证实了理论界和实践界之间的一致性。
Nov, 2015