仅标签的模型反演攻击：需要最少信息的攻击

Mar, 2022

仅标签的模型反演攻击：需要最少信息的攻击

Label-only Model Inversion Attack: The Attack that Requires the Least Information

Dayong Ye, Tianqing Zhu, Shuai Zhou, Bo Liu, Wanlei Zhou

TL;DR该研究论述了利用模型输出对数据记录进行逆推的方式，给出了基于置信度分数向量和目标模型参数的黑盒和白盒攻击方法，提出了一种仅需要标签输出就能成功逆推的新攻击方法，该方法利用目标模型的错误率计算数据记录到决策边界的中位数距离，生成置信分数向量并重构数据记录。实验结果表明相较于现有方法，我们的方法需要更少的信息即可成功重构高度可识别的数据记录。

Abstract

In a model inversion attack, an adversary attempts to reconstruct the data records, used to train a target model, using only the model's output. In launching a contemporary model inversion attack, the strategies

model inversion attack black-box attacks white-box attacks confidence score vectors data reconstruction

发现论文，激发创造

深度网络的成员模型反演攻击

本文介绍了一种更真实的模型反演攻击定义，并利用生成对抗网络的属性构建连通的低维流形。我们在此流形内实施的模型反演攻击表现出高效率。

Oct, 2019

用对抗性样本提升模型反演攻击

本文提出了一种新的训练范式，通过引入语义损失函数和注入对抗样本来增加训练数据的多样性，从而使攻击模型在数据重建过程中更加关注原始数据的类相关部分，进而提高现有学习攻击的性能。

Jun, 2023

仅标签模型倒装攻击的知识转移

提出了一种基于标签的模型反演攻击 (LOKT) 方法，通过知识转移和代理模型，在最具挑战性的标签唯一可用的攻击设置中提高了攻击成功率，同时突出了机器学习模型面临的日益攀升的隐私威胁。

Oct, 2023

通过边界排斥实现标签型模型反演攻击

该研究提出了一种名为 BREP-MI 的算法，该算法可以在隐私保护的前提下，仅通过目标模型的预测标签来还原出目标类别的私有训练数据，并在人脸识别等任务中进行了验证。

Mar, 2022

敏感属性是否处于隐私保护之中？针对分类模型的新型模型倒推属性推理攻击

本文聚焦于模型反演攻击，介绍了一种新的基于置信度分数的攻击方法和仅需要模型预测标签的攻击方法，并将攻击算法应用在决策树和深度神经网络上，评估了不同数据集在不同身份特征条件下的漏洞性。

Jan, 2022

基于强化学习的黑盒模型逆向攻击

本研究提出了一种基于强化学习的黑盒模型反演攻击方法，利用生成对抗网络（GANs）和 Markov 决策过程来搜索潜在空间以构建训练机器学习模型所用的隐私数据，并且在各种数据集和模型上取得了最先进的攻击性能。

Apr, 2023

针对迁移学习的模型倒置攻击：无需访问模型即可实现模型倒置

本文提出两种黑盒模型反演攻击方法，不需要查询学生模型，可以成功地从传统教师模型转移学习中的学生模型中恢复高度可识别的数据记录。

Mar, 2022

一次难以防御的攻击：通过条件扩散模型实现仅凭标签进行的模型推断

本文提出了在标签黑盒情况下使用条件扩散模型的新型 MIA 方法，可以在不需要额外优化的情况下恢复目标的精确样本，并将 Learned Perceptual Image Patch Similarity 作为评估度量之一进行系统定量和定性评估，实验证明，该方法可以在标签黑盒情况下生成与目标相似且准确的数据，并且优于先前方法的生成器

Jul, 2023

变分模型反演攻击

本研究提供了深度学习中一种重要的隐私保护策略，即基于变分自编码器和生成模型的攻击方法，可以更加准确地生成包含敏感数据的样本，并保持样本的多样性和真实性。

Jan, 2022

仅标签成员推断攻击

本文介绍了一种基于标签的会员推理攻击方法，通过对模型预测标签进行扰动来获取精细的成员信号，该攻击未被置换机密度分数的防御措施所挫败，仅采用差分隐私和（强）L2 正则化等防御策略才能有效地抵御所有攻击。

Jul, 2020