使用总变差距离的黑盒差分隐私审计

Jun, 2024

使用总变差距离的黑盒差分隐私审计

Black Box Differential Privacy Auditing Using Total Variation Distance

Antti Koskela, Jafar Mohammadi

TL;DR我们提出了一种实用的方法，使用一个未在训练中暴露给模型的小规模保留数据集来审计差分隐私（DP）保证。我们的方法利用得分函数（如训练期间使用的损失函数）估计使用训练数据子集和保留数据集获得的得分之间的总变差（TV）距离，在了解底层 DP 训练算法的一些元信息的情况下，这些 TV 距离值可以转换为任意 δ 的（𝜖, δ）保证。我们表明，这些得分分布渐近地为底层训练算法的 DP 保证提供下界，但基于实用性的原因，我们对其进行了一次估计。我们指定导致高概率下界 DP 保证的条件。为了估计得分分布之间的 TV 距离，我们使用了基于直方图的简单密度估计方法。我们表明，TV 距离提供了一个非常接近最优鲁棒估计器，并具有一个误差率𝒪(k^(−1/3))，其中 k 是总样本数。基准数据集上的数值实验说明了我们方法的有效性，并展示了对于黑盒审计的改进。

Abstract

We present a practical method to audit the differential privacy (DP) guarantees of a machine learning model using a small hold-out dataset that is not exposed to the model during the training. Having a score func

differential privacy machine learning model audit method total variation distance black-box auditing

发现论文，激发创造

鉴别性总变差距离估计：生成数据的保真度稽核器

本文基于判别性方法提出了一种评估生成数据保真度的方法，利用总变差距离作为有效的度量。通过定量地表征两个分布分类的贝叶斯风险和它们的总变差距离的关系，实现了总变差距离的估计。特别地，本文建立了关于两个高斯分布总变差距离估计误差收敛速率的理论结果。通过选择特定的分类假设类，能够实现总变差距离的快速收敛速率。当两个高斯分布之间的分离度越大时，估计总变差距离的准确性越高，这一现象也通过广泛的模拟得到了实证验证。最后，我们将该判别性估计方法应用于使用 MNIST 数据集的合成图像数据的保真度排序。

May, 2024

学习算法的统计不可区分性

本文讨论如何通过总变差（TV）距离度量学习规则的输出相似性，提出了 TV 不可辨认性的信息论等价性和统计学放大以及提升算法，并研究了基于 TV 不可辨认性的假设类可学习性。

May, 2023

总变差距离估计像概率推断一样简单

通过图模型和概率推理，本论文建立了总变差距离的新连接，提出了一种有效的降维方法，实现了对有界树宽的贝叶斯网分布进行总变差距离的估计。

Sep, 2023

近似最紧密的黑盒审计差分隐私机器学习

该研究通过黑盒模型对 Differentially Private Stochastic Gradient Descent (DP-SGD) 算法进行了近乎严格的审计，通过成员推理攻击经验性地估计了 DP-SGD 的隐私泄漏，并且估计结果接近理论 DP 边界。

May, 2024

在总变差距离下调整语言生成模型

采用总变差距离 (TVD) 为目标函数以及 TaiLr 目标函数，可以改善自回归解码期间的文本退化问题，同时在各种文本生成任务中提高生成质量。

Feb, 2023

学习高斯及更高模型的私有与多项式时间算法

提出了一个将差分隐私统计估计转化为无差分隐私的框架，并给出了用于学习高斯分布和鲁棒学习高斯分布的多项式时间差分隐私算法，该方法中学习高斯分布的样本复杂度和已知的信息论样本复杂度的上限相匹配，并且还证明了相似的结果，其中鲁棒学习高斯分布的样本复杂度更低。

Nov, 2021

纯差分隐私与近似差分隐私之间

该研究通过指定参数 delta 来构建一个全新的下界，从而优化（epsilon，delta）差分隐私算法在高维数据库上精确回答统计查询的样本复杂度。除了新的下界之外，该研究还提出了纯粹和近似的差分隐私算法，用于回答任意统计查询，并通过对比标准拉普拉斯和高斯机制在最坏情况下精度保证方面的样本复杂度，改善了对该问题的解决方法。

Jan, 2015

通过 $f$- 差分隐私统一增强混合机制的隐私边界

该研究聚焦于利用 f-DP 改进随机初始化的洗牌模型和一次迭代的差分隐私梯度下降（DP-GD）算法的隐私界限，并得到了洗牌模型的交替函数的闭式表达式，同时研究了随机初始化对于 DP-GD 的隐私影响。

Oct, 2023

使用 FFT 的离散值机制和子采样高斯机制的严格差分隐私

提出一种基于隐私损失分布的数值账本方法，用于准确隐私计算，尤其是对子采样高斯机制的严格上下界隐私参数的计算，并给出幂系数约束下的隐私损失分布的误差分析，应用于计数查询的指数机制的计算也满足严格下界隐私参数。

Jun, 2020

DP-SGD 对记录级推断的闭式界限

通过对 DP-SGD 算法进行具体分析，本文提出了一种新的方法，用于评估机器学习模型对特定记录类型的威胁（例如成员和属性推断）的隐私，而无需经过 DP 的间接方式。同时，还提供了一种与数据相关的边界用于对抗属性推论。

Feb, 2024