Nov, 2023

一张图片胜过千言万语:用于受限文本到图像合成的多属性逆转

TL;DR本文研究了使用用户提供的参考图像约束扩散模型输出的问题,旨在从单个参考图像中提取多个属性,并使用这些属性生成新的样本。首先,文中分析了在去噪过程的时间步维度和 DDPM 模型层维度中捕获的属性,并发现某些属性在相同的模型层和时间步骤中被捕获。基于这些发现,文中设计了一种新的多属性逆向算法 MATTE,可以明确分离四个属性(颜色、风格、布局和物体)。