Feb, 2017

生成模型的对抗性示例

TL;DR本篇研究探索在变分自编码器(VAE)和 VAE-GAN 等深度生成模型中生成对抗性样本的方法,并提出了三种攻击方式来测试针对 MNIST、SVHN 和 CelebA 数据集训练的网络,分别利用基于分类的对手,直接利用 VAE 的损失函数生成重构图像,以及直接优化源和目标潜在表示之间的差异。