插入播放攻击：朝向强韧与灵活的模型反演攻击

ICMLJan, 2022

插入播放攻击：朝向强韧与灵活的模型反演攻击

Plug & Play Attacks: Towards Robust and Flexible Model Inversion Attacks

Lukas Struppek, Dominik Hintersdorf, Antonio De Almeida Correia, Antonia Adler, Kristian Kersting

TL;DR本文提出了 Plug & Play 攻击方法，利用生成式对抗网络攻击目标分类器，实现了更具鲁棒性、更灵活和更具潜力的 MIAs，同时揭示了高质量、揭示敏感类别特征的图像可能性。

Abstract

model inversion attacks (MIAs) aim to create synthetic images that reflect the class-wise characteristics from a target classifier's private training data by exploiting the model's learned knowledge. Previous research has developed generative MIAs that use →

model inversion attacks generative adversarial networks plug & play attacks robustness class characteristics

发现论文，激发创造

Patch-MI: 提升基于补丁重建的模型逆向攻击

通过基于 Jigsaw 拼图组装的新概率模型和基于 GAN 的分析，Patch-MI 攻击方法能够成功生成与目标数据库分布相似的图片，甚至在辅助数据库分布不相似的情况下，通过随机变换块的巧妙应用，进一步提升目标分类器的效果，从而在保持统计数据集质量的同时，在准确性方面超越了现有的生成 MI 方法，标志着重要的进展。

Dec, 2023

黑盒解密：基于置信度的模型反演攻击与分布转移

本文提出了一种称为 CG-MI 的置信度引导模型反演攻击方法，利用预训练的可公开获取的生成对抗网络（GAN）的潜在空间作为先验信息和无梯度优化器，在不同数据分布的黑盒设置中实现了高分辨率的模型反演攻击。实验证明，我们的方法在 Celeba 和 Facescrub 的不同分布设置中，比 SOTA 黑盒 MIA 的攻击效果提高了超过 49％和 58％。此外，我们的方法能够生成与白盒攻击产生的质量相当的高质量图像。我们的方法为黑盒模型反演攻击提供了实用而有效的解决方案。

Feb, 2024

基于伪标签引导的条件生成对抗网络模型反演攻击

提出一种基于条件 GAN 的 PLG-MI 攻击策略，通过引入伪标签将搜索空间解耦，采用最大间隔损失改善目标分类的子空间搜索，实验表明本文方法攻击成功率和可视化质量效果明显优于当前先进攻击方法，特别是在大型分布转移下表现出 2~3 倍的优势。

Feb, 2023

一次难以防御的攻击：通过条件扩散模型实现仅凭标签进行的模型推断

本文提出了在标签黑盒情况下使用条件扩散模型的新型 MIA 方法，可以在不需要额外优化的情况下恢复目标的精确样本，并将 Learned Perceptual Image Patch Similarity 作为评估度量之一进行系统定量和定性评估，实验证明，该方法可以在标签黑盒情况下生成与目标相似且准确的数据，并且优于先前方法的生成器

Jul, 2023

知识增强的分布式模型反演攻击

本文提出了一种基于 Inversion-specific GAN 的新型模型反演攻击方法，通过训练鉴别器不仅区分真伪样本，而且包括目标模型提供的软标签，进而为每个目标类建模私人数据分布，成功率比先前的攻击方式有所提高（150%），而且普适于多种数据集和模型。

Oct, 2020

用对抗性样本提升模型反演攻击

本文提出了一种新的训练范式，通过引入语义损失函数和注入对抗样本来增加训练数据的多样性，从而使攻击模型在数据重建过程中更加关注原始数据的类相关部分，进而提高现有学习攻击的性能。

Jun, 2023

深度网络的成员模型反演攻击

本文介绍了一种更真实的模型反演攻击定义，并利用生成对抗网络的属性构建连通的低维流形。我们在此流形内实施的模型反演攻击表现出高效率。

Oct, 2019

生成分布对生成模型的成员推断攻击足够

通过仅利用目标生成模型的生成分布和辅助非成员数据集，我们提出了对各种生成模型（如生成对抗网络、变分自编码器、隐式函数和新兴的扩散模型）的第一个广义成员推断攻击，验证了所有生成模型都对我们的攻击易受攻击，我们呼吁设计和发布生成模型时要注意此类隐私泄漏风险。

Oct, 2023

神秘揭露者：针对深度神经网络的生成模型反演攻击

本文介绍了一种新型攻击方法 —— 生成模型反演攻击，它可以显著地提高逆转深度神经网络的准确率，攻击者使用部分公共信息学习分布先验，引导逆转过程，并且通过实验证明了差分隐私在该攻击下的防御效果有限。

Nov, 2019

变分模型反演攻击

本研究提供了深度学习中一种重要的隐私保护策略，即基于变分自编码器和生成模型的攻击方法，可以更加准确地生成包含敏感数据的样本，并保持样本的多样性和真实性。

Jan, 2022