May, 2024

扩散模型中定制概念的非混淆生成

TL;DR通过文本引导的扩散模型解决了组合概念生成中的常见挑战——概念之间的视觉混淆,并针对定制概念的生成提出了一种简单有效的解决方案CLIF:对比图像-语言微调,实验证明其在防止多定制概念生成中的混淆方面非常有效。