时间域子采样的隐私放大
本研究介绍一种新的方法,可通过随机抽样来提高差分隐私机制提供的隐私保证。该方法利用程序验证社区中出现的差分隐私特征,引入高级联合凸性和隐私概况等新工具,既可恢复和改进以往的分析,也可推导出新的隐私扩增实例。
Jul, 2018
我们研究了差分隐私和 Rényi-DP 框架下的群体隐私和分样本扩增,并提出了一种统一的分样本扩增隐私计算方法。我们的研究发现,这种方法不仅可以改进和推广现有的分样本扩增结果,还能导出比现有方法更严格的群体隐私扩增保证,从而将不同差分隐私属性的联合研究作为一个有希望的研究方向。
Mar, 2024
通过重要性抽样作为预处理步骤来检验数据子抽样的隐私增强特性,我们发现异质性抽样概率可以同时提供更强的隐私保护和更好的效用,并以保持子样本大小的方式评估基于重要性抽样的隐私增强在 k 均值聚类问题上的隐私、效率和准确性。
Jul, 2023
提出了一种使用泊松子采样的集成学习框架,有效地训练一组教师模型以针对训练数据发出一些不同隐私保护(DP)保证。通过在 DP 下 Boosting,从训练数据中派生的学生模型遭受的模型退化很少,可以从无隐私保护的模型中进行训练。
Oct, 2022
通过使用分层方法,可以在不用额外的隐私预算的情况下得到高准确性的全局统计学估计,从而减少差异的工作是减少差异的差异数据隐私机制应该被比较的一个强有力的基线。
Dec, 2023
本文研究了本地差分隐私模型下敏感统计信息的收集,提出了一种算法,其隐私成本与用户值的更改数量的对数成正比。通过匿名化用户报告,基于用户报告的匿名性,我们还展示了当以中心式差分隐私模型来看待时,我们的 LDP 算法的隐私成本实际上会更低。通过新的隐私放大技术,我们证明了任何置换不变的算法,满足 ε 局部差分隐私的同时,也会满足(O(ε sqrt {log(1/δ)/n)},δ)中心差分隐私。作为实际的推论,我们的研究结果表明,几个基于 LDP 的工业部署的隐私成本会比它们宣传的 ε 值所表示的要低得多,至少是在报告经过匿名化的情况下。
Nov, 2018
我们提出了一种用于在线流式数据生成的差分隐私合成算法,重点针对空间数据集。此外,我们提供了一个针对多个查询的在线选择性计数的通用框架,为查询回答和合成数据生成等多个任务提供基础。我们验证了算法在现实世界和模拟数据集上的实用性。
Jan, 2024