研究在数据即使隐私保护给定的情况下,隐私保证和结果统计估计器的效用之间的权衡,通过信息论和标准最小最大技术,提出本地隐私约束下统计速率的精确刻画,并提出新的隐私保护机制和计算有效的估计器,以实现界限。
Feb, 2013
本文详细研究了在保持从统计学家隐藏数据的严格设置中概率分布(离散和连续)的估计,给出了这些本地私有设置中估计的尖锐最小极限速率,展示了隐私和收敛速率之间的根本权衡,以及提供允许沿隐私 - 统计效率连续体移动的工具。我们结果的一个后果是,华纳关于随机响应的经典工作是进行调查抽样并保持受访者隐私的最佳方法。
May, 2013
本文研究数据保护与统计估计之间的平衡,开发了私有版本的信息熵界限,提出了一些新的基于隐私保护机制和计算效率估计,并给出了一些实验结果,证明了这些过程的重要性。
Apr, 2016
本文探讨了在分散式数据环境下,采用局部差分隐私保护敏感数据的可行性,设计了最优局部差分隐私机制,实现了在大规模数据训练下保护隐私,同时保证模型准确性。
Dec, 2018
我们探索和比较了隐私和披露限制的各种定义,在统计估计和数据分析中包括 (近似) 差分隐私、基于测试的隐私定义和对披露风险的后验保证。我们在定义之间给出了等价结果,揭示了不同形式隐私定义之间的关系。我们通过这些定义提供了最小化风险边界的推论视角,包括均值估计,分布支撑的估计和非参数密度估计。这些界限突出了不同隐私定义的统计后果,并为评估不同的披露限制技术的优势和劣势提供了第二个视角。
Dec, 2014
探讨平衡标准误差和隐私保护之间的关系,提出了最小化极限风险下的差分隐私约束的算法,包括隐私迭代硬阈值追踪,以及在实际数据集中表现出的数值表现。
Feb, 2019
提出并分析了一系列算法来解决在用户级差分隐私约束下的学习任务,包括高维均值估计、平滑损失函数的经验风险最小化、随机凸优化以及具有有限度量熵的学习假设类。
Feb, 2021
提出一种用于捕获用户向被动好奇敌手发布数据时产生的隐私威胁并在效用约束下加以限制的一般性统计推断框架,其中应用自信息成本函数于非渐进信息论方法用于表征最佳可实现的隐私,基于这些结果引入平均信息泄漏和最大信息泄漏两种隐私度量,证明在两种指标下,将用户数据映射到隐私保护输出的最优映射可被描述为修正的率失真问题并可设计成凸编程,最后与差分隐私进行比较。
Oct, 2012
探讨在分类和回归等多种模型中,为实现个体预测隐私保护所需的成本,以及通过训练多个模型并使用标准的聚合技术来预测,以降低聚合步骤引入的开销,并建立所有不同隐私预测算法的强广义保证,从而研究机器学习中差分隐私的最优样本调整量。
Mar, 2018
提出了一种经济解决方案,通过运用计算机科学中的生产模型来降低公布数据的隐私成本,达到精确统计和保护隐私的双重目标。在美国统计项目中应用了这一框架,但更好的理解隐私和统计准确性的购买意愿,对此提出了一个需要进一步探讨的方向。
Aug, 2018