Dec, 2023

文本图像生成模型中(非)预期记忆的理解

TL;DR多模态机器学习中的文本到图像模型,如 Stable Diffusion 和 DALL-E 3,以将文本转化为详细图像而变得重要。本文介绍了一种专门针对文本到图像模型的记忆定义,并根据用户期望将其分为三种不同类型。我们对意图记忆和非意图记忆之间的微妙差异进行了详细研究,并强调在模型输出的生成质量和用户隐私之间平衡的重要性。通过使用 Stable Diffusion 模型,我们提供了示例来验证我们的记忆定义并阐明其应用。