CVPRMar, 2024

NoiseCollage: 一种基于噪声裁剪和合并的布局感知文本到图像扩散模型

TL;DR本研究提出了一种新颖的布局感知的文本到图像扩散模型 NoiseCollage,它通过独立估计噪音并将其裁剪和合并为单个噪音,从而解决了文本和布局条件之间存在的不匹配以及生成图像质量下降的问题。定性和定量评估结果表明,NoiseCollage 优于几种最新模型,这些成功的结果表明使用噪音的裁剪和合并操作是一种合理的图像生成策略。还展示了将 NoiseCollage 与 ControlNet 集成以使用边缘、草图和姿势骨架作为附加条件,实验结果显示该集成提高了 ControlNet 的布局准确性。