时间域子采样的隐私放大

Jan, 2022

Privacy Amplification by Subsampling in Time Domain

Tatsuki Koga, Casey Meehan, Kamalika Chaudhuri

TL;DR为了在保持隐私的前提下利用时序数据，我们提出了一种基于子采样和过滤的隐私机制，通过减少个体对于时间序列的影响，从而显著地减小了加噪音的需求，而且我们用现实和合成的时间序列数据充分论证了其实用性。

Abstract

Aggregate time-series data like traffic flow and site occupancy repeatedly sample statistics from a population across time. Such data can be profoundly useful for understanding trends within a given population, but also pose a significant →

time-series data privacy risk differential privacy subsamplin filtering

发现论文，激发创造

随机子采样的隐私扩增：基于耦合和差异的严密分析

本研究介绍一种新的方法，可通过随机抽样来提高差分隐私机制提供的隐私保证。该方法利用程序验证社区中出现的差分隐私特征，引入高级联合凸性和隐私概况等新工具，既可恢复和改进以往的分析，也可推导出新的隐私扩增实例。

Jul, 2018

通过伯努利采样进行隐私放大

本文分析了从一个多维伯努利分布中采样给定私有算法的参数的隐私放大效应，提供了计算放大因子的算法，并建立了上下界，从而平衡隐私和准确性之间的的矛盾。

May, 2021

Rényi 差分隐私的群隐私放大和统一放大的子采样

我们研究了差分隐私和 Rényi-DP 框架下的群体隐私和分样本扩增，并提出了一种统一的分样本扩增隐私计算方法。我们的研究发现，这种方法不仅可以改进和推广现有的分样本扩增结果，还能导出比现有方法更严格的群体隐私扩增保证，从而将不同差分隐私属性的联合研究作为一个有希望的研究方向。

Mar, 2024

迭代式隐私放大

使用微分隐私技术对加性迭代算法的中间结果进行保护，避免泄露中间过程可以强化隐私保障并解决凸优化问题。

Aug, 2018

隐私放大通过重要性抽样

通过重要性抽样作为预处理步骤来检验数据子抽样的隐私增强特性，我们发现异质性抽样概率可以同时提供更强的隐私保护和更好的效用，并以保持子样本大小的方式评估基于重要性抽样的隐私增强在 k 均值聚类问题上的隐私、效率和准确性。

Jul, 2023

一种带泊松子抽样的集成师生学习方法，用于差分隐私保护语音识别

提出了一种使用泊松子采样的集成学习框架，有效地训练一组教师模型以针对训练数据发出一些不同隐私保护（DP）保证。通过在 DP 下 Boosting，从训练数据中派生的学生模型遭受的模型退化很少，可以从无隐私保护的模型中进行训练。

Oct, 2022

一个简单实用的方法来减少差异隐私的不均衡影响

通过使用分层方法，可以在不用额外的隐私预算的情况下得到高准确性的全局统计学估计，从而减少差异的工作是减少差异的差异数据隐私机制应该被比较的一个强有力的基线。

Dec, 2023

从局部到中心差分隐私的扩大：通过匿名化实现

本文研究了本地差分隐私模型下敏感统计信息的收集，提出了一种算法，其隐私成本与用户值的更改数量的对数成正比。通过匿名化用户报告，基于用户报告的匿名性，我们还展示了当以中心式差分隐私模型来看待时，我们的 LDP 算法的隐私成本实际上会更低。通过新的隐私放大技术，我们证明了任何置换不变的算法，满足 ε 局部差分隐私的同时，也会满足（O（ε sqrt {log（1/δ）/n）}，δ）中心差分隐私。作为实际的推论，我们的研究结果表明，几个基于 LDP 的工业部署的隐私成本会比它们宣传的 ε 值所表示的要低得多，至少是在报告经过匿名化的情况下。

Nov, 2018

隐私保护贝叶斯数据分析的理论与实践

使用 Laplace 机制对数据进行隐私保护的方法效率与非私有后验推断相同，可用于敏感军事记录的时间序列分析，并具有隐私预算的有效利用优势。

Mar, 2016

PrivStream: 流式差分隐私数据的算法

我们提出了一种用于在线流式数据生成的差分隐私合成算法，重点针对空间数据集。此外，我们提供了一个针对多个查询的在线选择性计数的通用框架，为查询回答和合成数据生成等多个任务提供基础。我们验证了算法在现实世界和模拟数据集上的实用性。

Jan, 2024