Mar, 2024

逆转 CLIP 模型带给我们什么启示?

TL;DR我们使用反演方法研究了 CLIP 模型,发现其反演结果生成的图像与指定的目标提示存在语义对齐。我们利用这些反演图像深入了解了 CLIP 模型的各个方面,如其概念融合能力和性别偏见的包含。我们特别观察到模型反演过程中出现了不安全的图像,即使对于语义无伤的提示(如 “美丽的风景”)或涉及名人的提示。