研究在数据即使隐私保护给定的情况下,隐私保证和结果统计估计器的效用之间的权衡,通过信息论和标准最小最大技术,提出本地隐私约束下统计速率的精确刻画,并提出新的隐私保护机制和计算有效的估计器,以实现界限。
Feb, 2013
本文详细研究了在保持从统计学家隐藏数据的严格设置中概率分布(离散和连续)的估计,给出了这些本地私有设置中估计的尖锐最小极限速率,展示了隐私和收敛速率之间的根本权衡,以及提供允许沿隐私 - 统计效率连续体移动的工具。我们结果的一个后果是,华纳关于随机响应的经典工作是进行调查抽样并保持受访者隐私的最佳方法。
May, 2013
我们探索和比较了隐私和披露限制的各种定义,在统计估计和数据分析中包括 (近似) 差分隐私、基于测试的隐私定义和对披露风险的后验保证。我们在定义之间给出了等价结果,揭示了不同形式隐私定义之间的关系。我们通过这些定义提供了最小化风险边界的推论视角,包括均值估计,分布支撑的估计和非参数密度估计。这些界限突出了不同隐私定义的统计后果,并为评估不同的披露限制技术的优势和劣势提供了第二个视角。
Dec, 2014
本文为研究局部隐私约束下的估计方案制定下限,推导出了私有估计和受通信限制的估计问题之间的等价性,适用于任意交互的隐私机制,并且得出了所有不同隐私保护级别的尖锐下限。作者作为对研究结果的一个重要推论,证明了有界或高斯随机向量的均值估计的最小最大均方误差按比例缩放的结论为 $d/n * d/min (ε,ε^2)$ 。
Feb, 2019
本文研究在隐私模型下的统计风险最小化问题,针对局部隐私框架,确定了统计估计过程的收敛速率上下限,并展示了数据保留隐私量与任何统计估计器或学习程序的收敛速率之间的精确权衡。
Oct, 2012
使用构建的差分隐私版本的梯度下降算法,针对低维和高维稀疏广义线性模型提出参数估计,通过表征统计学性能和建立 GLMs 的隐私约束极小值下界来显示所提算法的近乎速率最优性。
Nov, 2020
探讨平衡标准误差和隐私保护之间的关系,提出了最小化极限风险下的差分隐私约束的算法,包括隐私迭代硬阈值追踪,以及在实际数据集中表现出的数值表现。
研究局部差分隐私在高斯分布参数估计中的应用,并给出了自适应的两轮解决方案和非自适应的一轮解决方案,并通过信息理论下界证明了准确性保证的紧密性。
Nov, 2018
本文使用中心差分隐私提出了 Le Cam 方法、Fano 不等式和 Assouad 引理的类似物,并且通过该方法在多个统计估计任务中建立了样本复杂性边界,包括离散分布估计和 l2 距离评估。我们还提供了针对几个其他分布类别的下界,包括产品分布和高斯混合分布,这些下界在对数因子上是精确的。我们的技术贡献在于将分布之间的耦合与基于差分隐私的估计的样本复杂度相关联。
Apr, 2020
本文提出了一种统一的框架,用于基于交互式协议的分布式参数估计,可以导出各种紧密下限,适用于不同的参数分布族;特别是在高斯家族的原型情况下,我们的方法可以规避以往技术的局限性,并补充了匹配的上限。
Oct, 2020