Feb, 2024

对比提示改善文本到图像扩散模型中的解缠

TL;DR通过对分类器的自由引导的简单修改,该论文展示了 Contrastive Guidance 方法可以帮助在文本到图像模型中解开图像因素,从而提供对图像因素更精细的控制。该方法的关键思想是使用两个仅在最小标记上有差异的提示对所需的因素进行描述,其中正面提示描述待合成的图像,基准提示作为 “基准” 以解开其他因素。这种方法在三个场景下的优势体现为:(1)指导在对象类上训练的领域特定扩散模型,(2)为文本到图像生成提供连续的、类似骨骼的控制,以及(3)提高零 - shot 图像编辑器的性能。