May, 2024

在组合下避免子采样机制的隐私计算陷阱

TL;DR我们考虑计算子采样差分私有机制组合的紧密隐私保证的问题。我们的主要贡献在于解决了两个常见的困惑:一是有些隐私估计者认为,子采样机制组合的隐私保证是通过自组合未组合机制的最坏情况数据集来确定的;二是泊松子采样有时被假设具有与无替换采样相似的隐私保证,但我们表明这两种采样方案的隐私保证可能存在显著差异。具体而言,我们给出了一个示例,其中泊松子采样的 ε≈1,而无替换采样的 ε>10。这对于实际可选择的 DP-SGD 参数而言是可能发生的。