Dec, 2023

阅读指导:从扩散特征中学习控制

TL;DR我们提出了一种名为 Readout Guidance 的方法,用于通过学习的信号控制文本到图像扩散模型。该方法使用读取头,在每个时间步从预训练的冻结扩散模型的特征中提取信号。这些读出可以编码单一图像属性,如姿态、深度和边缘;或者编码多个图像相关的高阶属性,如对应关系和外观相似性。此外,通过将读出估计与用户定义的目标进行比较,并通过读出头向后传播梯度,可以使用这些估计来指导采样过程。与先前的有条件生成方法相比,Readout Guidance 需要更少的添加参数和训练样本,并提供了一个方便而简单的方法来在一个框架、一个架构和一个采样过程下重现不同形式的条件控制。我们展示了在拖动式操作、身份一致生成和空间对齐控制的应用中的这些优势。