私密统计推断的重采样方法

Feb, 2024

Resampling methods for Private Statistical Inference

Karan Chadha, John Duchi, Rohit Kuditipudi

TL;DR通过构建隐私差分的置信区间，我们提出了两种非参数私有化自举方法，可以在数据的多个分区上私下计算多个 “小” 自举结果的中位数，并给出了对生成置信区间的渐近界限的错误率。对于固定的差分隐私参数 ε，我们的方法在样本量 n 中与非私有自举方法的错误率相似，只有对数因子的差异。我们通过真实数据和合成数据对我们方法的均值估计、中位数估计和逻辑回归的性能进行了实证验证。我们的方法在提供相似的覆盖准确性的同时，相较以前的方法提供了明显更短的（约 10 倍）置信区间。

Abstract

We consider the task of constructing confidence intervals with differential privacy. We propose two private variants of the non-parametric bootstrap, which privately compute the median of the results of multiple

confidence intervals differential privacy non-parametric bootstrap coverage error privacy parameter

发现论文，激发创造

差分隐私置信区间

本文提出五种实用的差分隐私算法用于计算正态分布数据的总体均值的置信区间，并将其与以前的工作进行比较，实验结果表明本文算法提供比以前的工作更准确的置信区间。

Jan, 2020

有限样本的差分隐私置信区间

本文研究在差分隐私的限制下，对正态总体均值进行有限样本置信区间的估计问题。我们考虑知道和未知方差情况，并构建了具有差分隐私的算法来估计置信区间，与大多数以前的算法不同的是，我们不要求样本的定义域是有界的。此外，本文还证明了差分隐私置信集的预期大小下界，表明我们的参数在多对数因子意义下是最优的。

Nov, 2017

非病态数据的差分隐私中位数和内点

构建差分隐私估计量，可通过低样本复杂度估计在满足非常温和的矩条件下的任意分布的中位数。

May, 2023

平均情况下的平均值：用于平滑敏感性和均值估计的私有算法

本文提出了一种实例依赖的差分隐私噪声缩放方法，并使用修剪均值估计器对平均分布假设下的实现进行了实验和理论分析，结果显示该方法相对于其他文献中的方法有较好的效果。同时，文章也重新审视了 Nissim、Raskhodnikova 和 Smith (STOC 2007) 的模糊敏感度框架，并提出了三种新的加性噪声分布，它们在平滑敏感度的缩放下提供了集中型的差分隐私。

Jun, 2019

具有覆盖保证的神经网络快速、无分布预测推断

本文提出一种新颖、计算有效的算法来进行预测推断，其对数据没有分布假设，并且可以比基于引导类型的神经网络方法更快地计算。

Jun, 2023

基于稳定中位数的自适应估计器泛化

本文主要介绍了一种基于近似中位数算法的算法来估算统计数据集的普适性，该算法满足差分隐私的强稳定性保证，解决了统计数据集在自适应问题上的泛化保证的新方法。

Jun, 2017

关于高维重抽样的一些非渐进结果，I：置信域，II：多重检验

本文研究了应用于具有未知依赖关系结构的随机向量均值的广义自助法置信区间，并针对高维向量进行非渐近控制，分别采用了基于浓度原理和基于重新采样分位数量化的方法，并且考虑了蒙特卡罗法的精度问题。

Dec, 2007

隐私保护数据的条件密度估计

在该研究中，我们提出了基于模拟的隐私保护数据集推理方法，利用神经条件密度估计器近似后验分布，纠正隐私保护机制引入的偏差，并展示了隐私与效用之间的权衡的必要性和可行性。

Oct, 2023

本地化隐私高斯估计

研究局部差分隐私在高斯分布参数估计中的应用，并给出了自适应的两轮解决方案和非自适应的一轮解决方案，并通过信息理论下界证明了准确性保证的紧密性。

Nov, 2018

基于个体级差分隐私的私有均值估计

研究多样本时的差分隐私均值估计，在用户级别设置下，给出了人数的必要和充分条件以实现在 ε- 差分隐私（及其常见松弛条件）下在ℓ2 范数中以距离 α 估计均值的结果，并提供了近似差分隐私的高效算法（在样本复杂性上略有降低）和纯差分隐私的低效算法的计算方法和边界分析。

May, 2024