通过扰动损失特征提升自动语音识别模型审计中的成员推断

May, 2024

通过扰动损失特征提升自动语音识别模型审计中的成员推断

Improving Membership Inference in ASR Model Auditing with Perturbed Loss Features

Francisco Teixeira, Karla Pizzi, Raphael Olivier, Alberto Abad, Bhiksha Raj...

TL;DR该研究探索了在自动语音识别模型中，利用基于损失的特征与高斯和对抗性扰动进行成员推断 (MI) 的有效性。与常用的基于错误的特征相比，我们提出的特征大大增强了样本级 MI 的性能。对于说话人级 MI，这些特征也改善了结果，尽管改进幅度较小，因为基于错误的特征已经在这个任务中表现出很高的性能。我们的发现强调了在 ASR 系统中考虑不同特征集和访问目标模型的级别对于有效的 MI 的重要性，为审计这些模型提供了有价值的见解。

Abstract

membership inference (MI) poses a substantial privacy threat to the training data of automatic speech recognition (ASR) systems, while also offering an opportunity to audit these models with regard to user data.

membership inference automatic speech recognition loss-based features gaussian and adversarial perturbations sample-level mi

发现论文，激发创造

通过自提示校准对精调大型语言模型进行实用的成员推断攻击

基于自校准概率变异的成员推断攻击（SPV-MIA）提出了一种新的对严格微调但无过拟合和隐私保护的 LLMs 泄露隐私的成员推断攻击方法。

Nov, 2023

关于成员推断攻击的不信任

本文探讨了使用 MI 攻击来检测敏感数据泄露的问题，结果发现 MI 攻击容易被挑战其可靠性，并提出一种新的算法，将假阳性率提高至数千倍。

Dec, 2022

隶属推断攻击的难度

该论文研究深度学习中的成员推理攻击，指出现有攻击方法的报告中存在高误报率 (FAR) 和针对误分样本的较弱识别能力，并探索了距离决策边界和梯度范数等新特征，证明其对误分类样本分类能力普遍一般，最后通过多项实验证明了现有的 MI 攻击较难同时实现高准确率和低 FAR。

May, 2020

RelaxLoss：在不损失效用的情况下防御成员推断攻击

通过提出一种基于松弛损失的新型训练框架，RelaxLoss，使得机器学习模型对隐私成了更加稳健，提高了鲁棒性和模型效用。

Jul, 2022

使用对抗扰动进行的 DNN 成员推断攻击

研究了针对深度神经网络的成员推理攻击，提出了对复杂数据集 LiRA 和 EMIA 的补救方法，并提出了一种新的攻击方法 AMIA 和 E-AMIA，同时引入了一些增强指示标志及新的评估指标。

Jul, 2023

成员推断攻击的数据和模型依赖性

该论文分析了成员推理攻击的成功因素，发现数据集和训练模型的多个属性共同影响攻击成功率，提出使用这些属性作为正则化器以保护机器学习模型免受攻击。经实验证明，该方法可将攻击准确率降低多达 25％，而不影响机器学习模型的预测效果。

Feb, 2020

机器学习模型增强攻击下的成员推断攻击

通过成员推理攻击作为审核工具，我们提出了一个综合的假设检验框架，不仅能够以一致的方式正式表达先前的工作，还可以设计新的成员推理攻击，使用参考模型来实现任意误报率的显著更高的功率（真正的阳性率），并解释为什么不同的攻击效果不同，并最小化攻击不确定性到数据点的存在或缺失的一个比特秘密。

Nov, 2021

利用模型记忆进行校准的白盒成员推断：窃取的记忆

本研究通过对深度神经网络如何发生过拟合的新认识，研究了成员推断攻击，并展示了如何利用模型的内部来提供攻击者成员身份的证据，该攻击方法可校准，并可以有效地进行高精度的成员推论。同时，对于流行的成员推断攻击防御方法，发现较小的一阶差分隐私并不能防止攻击，而较大的隐私预算则使得攻击几乎具有与未受保护的模型相同的准确性。

Jun, 2019

通过对抗鲁棒性评估成员推断

本文提出了一种基于对抗鲁棒性的增强成员推断攻击方法，通过标签平滑调整对抗性扰动的方向，在白盒设置下对 Fashion-MNIST、CIFAR-10 和 CIFAR-100 三种数据集进行了实验，结果表明该方法的性能优于现有的基于对抗性鲁棒性的方法，且在攻击对抗性训练模型方面，更胜一筹。

May, 2022

MI 攻击所需的只有信心

该研究论文介绍了一种新的方法来评估数据点在模型的训练集中的成员资格，并利用机器学习模型生成的分类置信度值和无需知道给定数据点的真实类别的变体方法进行成员推断攻击。

Nov, 2023