Nov, 2022

向文本编码器注入后门,滋扰艺术创作:文本到图像合成

TL;DR介绍了一种针对文本引导的生成模型的后门攻击,揭示了文本编码器的实际修改可能性和潜在威胁,并通过在提示中插入单个字符触发器的方式,演示了攻击的高有效性。同时,还讨论了如何强制让编码器从忘记一些相关的概念,以便更加安全地生成图像。