Dec, 2023

通过分位数回归对扩散模型进行的成员推断攻击

TL;DR扩散模型具有高质量输出,但容易泄漏训练数据的具体信息,我们提出了成员推断攻击一文,通过量化回归模型预测训练集以外示例的重构损失分布,并使用自定义阈值在重构损失上进行假设检验,最终确定数据点是否属于训练集。我们还提供了简单的引导技术,通过多个弱攻击者的多数成员预测来提高准确性,相较于以往的攻击方法而言,我们的攻击方法计算成本低得多。