Jun, 2024

嘈杂邻居:针对 LLMs 的高效成员推断攻击

TL;DR该研究论文介绍了一种高效的方法,通过在嵌入空间中添加随机噪声,在推理模式下操作目标模型,生成目标样本的 “噪声邻居”,以评估 LLMs 的隐私风险。研究结果表明,该方法与使用影子模型的效果相近,展示了它在实际隐私审计场景中的可用性。