个性化矫正流：锚定分类器指导

May, 2024

RectifID: Personalizing Rectified Flow with Anchored Classifier Guidance

Zhicheng Sun, Zhenhao Yang, Yang Jin, Haozhe Chi, Kun Xu...

TL;DR利用分类器指导，我们研究了个性化图像生成的问题，并通过基于修正流框架的解决方法，实现了灵活个性化生成结果。

Abstract

Customizing diffusion models to generate identity-preserving images from user-provided reference images is an intriguing new problem. The prevalent approaches typically require training on extensive domain-specific images to achieve →

diffusion models identity preservation classifier guidance personalized image generation off-the-shelf image discriminators

发现论文，激发创造

分类器引导扩散生成的设计空间阐明

通过使用现成的预训练分类器在无需额外计算成本的情况下，提出了预处理技术来引导扩散生成，旨在实现比现有方案更显著的性能改进，尤其是在图像生成任务中。

Oct, 2023

个性化扩散的身份编码器

论文探讨了使用编码器和扩散生成器来进行个性化图像生成的方法，并比较了该方法与 Fine-tuning 等已有方法的性能，实验结果表明，该方法在图像生成和重建上表现更好，且适用于更多应用场景。

Apr, 2023

文本到图像矫正流作为即插即用的先验

大规模扩散模型在生成任务中取得了显著的性能。矫正流是一种新的生成模型类别，在各个领域展现出了优越的性能。通过理论和实验证据，我们展示了基于矫正流的方法与扩散模型具有相似的功能，可以作为有效的先验。此外，基于矫正流的先验方法在图像反转方面表现出优越的性能。

Jun, 2024

以自身的错误版本引导扩散模型

使用自身较小、较少训练的模型而不是无条件模型，引导生成图像，可以获得图像质量分离的控制，同时不减少变化量。这在 ImageNet 生成方面有显著的改进，64x64 像素的 FID 为 1.01，512x512 像素的 FID 为 1.25，使用公开可用的网络。此方法还适用于无条件扩散模型，大幅提高它们的质量。

Jun, 2024

扩散自导式可控图片生成

本篇研究介绍了 self-guidance 这一新方法，通过指导扩散模型的内部表示，提供了对生成图像更强的控制力，可以从这些表示中提取对象的形状、位置和外观等属性，并使用它们来控制生成的采样，这种方法类似于分类器引导，但是不需要额外的模型或训练，作者演示了如何使用这种方法进行复杂的图像操作，如修改对象的位置或大小，合并图像中对象的外观和布局等，并证明了 self-guidance 还可以用于编辑真实图像。

Jun, 2023

改进校正流的训练

改进的矫正流训练方法在低 NFE 下能够与知识蒸馏方法竞争，实现了较高的图像生成质量和性能。

May, 2024

即插即用扩散蒸馏

我们提出了一种新的蒸馏方法，可以减少迭代计算过程中无需分类器指导的扩散模型的推理计算时间，并且只需要基础模型的 1％的可训练参数，同时还能维持生成图像的视觉逼真度。

Jun, 2024

关于引导式扩散模型的精馏

本文介绍了一种将分类器自由引导扩散模型蒸馏为更快采样的方法，以减少推理时间，并取得了与原始模型相当的图像有效性。

Oct, 2022

自导扩散模型

本文介绍了一种自导扩散模型的方法，它可以利用自我监督信号来提供图像生成的指导，而无需大量的图像注释对。通过结合特征提取功能和自注释功能，我们的方法可以为各种图像颗粒度提供指导信号，从整体图像到对象框甚至分割掩模。我们的实验表明，我们的方法在单标签和多标签图像数据集上总是优于无指导的扩散模型，甚至可能超过基于基础真实标签的指导，特别是在不平衡数据上。

Oct, 2022

在任何场景中生成任何物体

我们提出了一种简单高效的数据增强训练策略，通过插入适配器层来引导扩散模型仅专注于对象身份，使得我们的模型具备控制每个生成个性化对象的位置和大小的能力，并提出了区域引导抽样技术来保持生成图像的质量和保真度。

Jun, 2023