Feb, 2024

黑盒解密:基于置信度的模型反演攻击与分布转移

TL;DR本文提出了一种称为 CG-MI 的置信度引导模型反演攻击方法,利用预训练的可公开获取的生成对抗网络(GAN)的潜在空间作为先验信息和无梯度优化器,在不同数据分布的黑盒设置中实现了高分辨率的模型反演攻击。实验证明,我们的方法在 Celeba 和 Facescrub 的不同分布设置中,比 SOTA 黑盒 MIA 的攻击效果提高了超过 49%和 58%。此外,我们的方法能够生成与白盒攻击产生的质量相当的高质量图像。我们的方法为黑盒模型反演攻击提供了实用而有效的解决方案。