具有贝叶斯差分隐私的自适应统计学习

MMNov, 2019

具有贝叶斯差分隐私的自适应统计学习

Adaptive Statistical Learning with Bayesian Differential Privacy

Jun Zhao

TL;DR通过使用贝叶斯差分隐私技术，本研究表明，对于存在不相关性和相关性的数据样本，通过扰动和协调估计值可在自适应统计学习中重复使用保留数据集。

Abstract

In statistical learning, a dataset is often partitioned into two parts: the training set and the holdout (i.e., testing) set. For instance, the training set is used to learn a predictor, and then the holdout set

statistical learning training set holdout dataset generalization differential privacy

发现论文，激发创造

自适应数据分析与留存重用中的泛化

本文针对过拟合问题，提出了一种适用于自适应数据分析的算法，使用保留集重复验证后得到的假设，避免了过度拟合问题，同时利用描述长度和差分隐私，展示了在适应性场景下保证统计有效性的方法，并通过近似最大信息的方法将这些方法统一起来。

Jun, 2015

具有差分隐私的数据分析

本论文利用差分隐私算法对分布式和流数据进行分析，通过学习全局数据模型并保障差分隐私，提出了三种分布式学习贝叶斯网络模型的新方法，并针对流数据中的用户密度估计问题，提供了用户级别的隐私保护算法和改进策略。

Jul, 2023

基于稳定中位数的自适应估计器泛化

本文主要介绍了一种基于近似中位数算法的算法来估算统计数据集的普适性，该算法满足差分隐私的强稳定性保证，解决了统计数据集在自适应问题上的泛化保证的新方法。

Jun, 2017

机器学习的贝叶斯差分隐私

提出了基于贝叶斯的差分隐私方法，并实验表明基于样本数据分布的隐私保护方法比传统方法更实用有效。

Jan, 2019

训练知道自己不知道什么的私有模型

通过研究选择性分类器在差分隐私约束下的效果，探讨深度学习模型的可靠性及隐私泄漏问题，发现最近的一种基于现成的深度学习模型生成检查点的方法在差分隐私下更为合适，使用差分隐私不仅会降低模型的效能，而且在隐私预算降低时需要付出相当大的覆盖成本。

May, 2023

保护重构及其在私有联邦学习中的应用

本文探讨了在分散式数据环境下，采用局部差分隐私保护敏感数据的可行性，设计了最优局部差分隐私机制，实现了在大规模数据训练下保护隐私，同时保证模型准确性。

Dec, 2018

惩罚约束似然的差分隐私模型选择

本文主要研究如何将差分隐私的保护机制融入多元线性回归建模中，并提出了一种基于惩罚最小二乘估计和随机化的算法来实现此目标，该算法在最优化时更加敏感于参数的选择，但保证了与非差分隐私的程序同样的一致性。

Jul, 2016

隐私保护数据的条件密度估计

在该研究中，我们提出了基于模拟的隐私保护数据集推理方法，利用神经条件密度估计器近似后验分布，纠正隐私保护机制引入的偏差，并展示了隐私与效用之间的权衡的必要性和可行性。

Oct, 2023

自适应数据分析中维护统计学有效性

关于如何在自适应数据分析中保证统计推断的有效性的研究，使用隐私保护技术协调估计值，并在估计指数数量的期望时取得了指数级的改进，适用于多重假设检验和虚假发现率控制。

Nov, 2014

重新审视差分隐私线性回归：无界域中的最优自适应预测和估计

本文研究了在差分隐私约束下的线性回归问题，恢复了特征、标签和系数域在优化误差和估计误差中的正确依赖性，并提出了两种简单修改的差分隐私算法：后验采样和充足统计扰动，并展示它们可升级为能针对每个实例利用数据相关量并行为几乎最优的自适应算法。作者在 36 个数据集上进行了广泛的实验，结果表明两种自适应算法优于现有技术。

Mar, 2018