Jun, 2024

CFG++:约束流形的无监督扩散模型分类器引导

TL;DR通过将文本引导问题重新定义为一个逆问题,并使用基于扩散模型的逆问题求解器,本文提出了一种名为 CFG++ 的新方法来解决传统 CFG 中存在的问题,包括改善文本到图像生成的样本质量、可逆性、减少模式崩溃等方面的显著改进,同时在所有规模上始终优于传统 CFG。实验证实了我们的方法在文本到图像生成、DDIM 反演、编辑和求解逆问题方面显著提高了性能,表明其在利用文本引导的各个领域中具有广泛的影响和潜在应用。