SLMIA-SR: 论说者级别成员推断攻击对说话人识别系统

Sep, 2023

SLMIA-SR: 论说者级别成员推断攻击对说话人识别系统

SLMIA-SR: Speaker-Level Membership Inference Attacks against Speaker Recognition Systems

Guangke Chen, Yedi Zhang, Fu Song

TL;DR提出了 SLMIA-SR，该方法是第一个针对 SR 定制的成员推断攻击，使用声纹识别和训练目标特征工程，通过训练模型和攻击模型的相关性来验证声纹在训练集中的成员关系，实验证明了攻击的效果。

Abstract

membership inference attacks allow adversaries to determine whether a particular example was contained in the model's training dataset. While previous works have confirmed the feasibility of such attacks in various applications, none has focused on →

membership inference attacks speaker recognition voice-based biometric recognition intra-closeness and inter-farness attack performance

发现论文，激发创造

大型语言模型的语义成员推断攻击

通过利用输入和其扰动的语义内容，我们引入了一种新的方法 —— 语义成员推断攻击（SMIA），从而提高成员推断攻击（MIAs）的性能。我们使用维基百科数据集对 Pythia 和 GPT-Neo 模型家族进行了全面评估，结果表明 SMIA 在 AUC-ROC 方面显著优于现有的 MIAs，例如，与第二好的攻击相比，SMIA 在 Pythia-12B 上实现了 67.39% 的 AUC-ROC，而第二好的攻击仅为 58.90%。

Jun, 2024

通过自提示校准对精调大型语言模型进行实用的成员推断攻击

基于自校准概率变异的成员推断攻击（SPV-MIA）提出了一种新的对严格微调但无过拟合和隐私保护的 LLMs 泄露隐私的成员推断攻击方法。

Nov, 2023

基于采样的伪似然函数在成员推断攻击中的应用

该研究提出了一种基于采样的伪似然方法（SaMIA），通过仅使用大型语言模型生成的文本来计算伪似然，以检测数据泄漏，即使没有似然度，SaMIA 的表现与现有的基于似然度的方法相媲美。

Apr, 2024

关于成员推断攻击的不信任

本文探讨了使用 MI 攻击来检测敏感数据泄露的问题，结果发现 MI 攻击容易被挑战其可靠性，并提出一种新的算法，将假阳性率提高至数千倍。

Dec, 2022

机器学习中的成员推断攻击：一项调查

本文首次对机器学习中的成员推理攻击及其防御措施进行了全面调查，提供了攻击和防御的分类学及其优缺点，并指出了相关领域的研究限制和未来方向，为研究社区提供了参考。

Mar, 2021

从第一原理推导的成员推断攻击

本文针对成员推断攻击，提出了一种基于似然比的攻击方法，并认为攻击应该在低误报率下进行评估，发现以往攻击方法在该评估指标上表现欠佳。

Dec, 2021

大型语言模型是否受到成员推断攻击的影响？

成员推理攻击的大规模评估发现在多种设置中，大型语言模型的预训练数据上的成员推理攻击表现较差，主要原因是庞大数据集和较少训练迭代之间的结合，以及成员和非成员之间存在模糊的边界。我们识别出特定的设置，这些设置中语言模型易受成员推理攻击影响，并证明这种成功可以归因于分布变化，例如成员和非成员从看似相同的领域，但具有不同的时间范围。我们提供了代码和数据，形成了一个统一的基准测试套件，包括所有现有的成员推理攻击方案，以支持未来的研究工作。

Feb, 2024

高效的子人群成员推理攻击

通过引入基于同质子集方法的会员推断攻击方案，本文成功提高了会员推断的准确性，同时极大地降低了对深度模型的计算成本。

Mar, 2022

使用对抗扰动进行的 DNN 成员推断攻击

研究了针对深度神经网络的成员推理攻击，提出了对复杂数据集 LiRA 和 EMIA 的补救方法，并提出了一种新的攻击方法 AMIA 和 E-AMIA，同时引入了一些增强指示标志及新的评估指标。

Jul, 2023

LLM 数据推断：你在我的数据集上训练了吗？

大语言模型在现实世界中的大量使用产生了对公司以未经许可的方式在互联网上训练模型的版权纠纷。本文提出了一种新的数据集推断方法来准确识别用于训练大语言模型的数据集，成功地区分了不同子集的 Pile 数据集的训练集和测试集，无任何错误的正例。

Jun, 2024