Aug, 2022

利用虚构单词的图像生成对抗攻击

TL;DR该研究提出了两种方法,通过使用 nonce words 来引导图像生成模型并对其进行调整,从而产生与特定视觉概念相关的图像,并讨论了这些技术对绕过现有内容审查方法的影响。