个性化矫正流:锚定分类器指导
论文探讨了使用编码器和扩散生成器来进行个性化图像生成的方法,并比较了该方法与 Fine-tuning 等已有方法的性能,实验结果表明,该方法在图像生成和重建上表现更好,且适用于更多应用场景。
Apr, 2023
大规模扩散模型在生成任务中取得了显著的性能。矫正流是一种新的生成模型类别,在各个领域展现出了优越的性能。通过理论和实验证据,我们展示了基于矫正流的方法与扩散模型具有相似的功能,可以作为有效的先验。此外,基于矫正流的先验方法在图像反转方面表现出优越的性能。
Jun, 2024
使用自身较小、较少训练的模型而不是无条件模型,引导生成图像,可以获得图像质量分离的控制,同时不减少变化量。这在 ImageNet 生成方面有显著的改进,64x64 像素的 FID 为 1.01,512x512 像素的 FID 为 1.25,使用公开可用的网络。此方法还适用于无条件扩散模型,大幅提高它们的质量。
Jun, 2024
本篇研究介绍了 self-guidance 这一新方法,通过指导扩散模型的内部表示,提供了对生成图像更强的控制力,可以从这些表示中提取对象的形状、位置和外观等属性,并使用它们来控制生成的采样,这种方法类似于分类器引导,但是不需要额外的模型或训练,作者演示了如何使用这种方法进行复杂的图像操作,如修改对象的位置或大小,合并图像中对象的外观和布局等,并证明了 self-guidance 还可以用于编辑真实图像。
Jun, 2023
本文介绍了一种自导扩散模型的方法,它可以利用自我监督信号来提供图像生成的指导,而无需大量的图像注释对。通过结合特征提取功能和自注释功能,我们的方法可以为各种图像颗粒度提供指导信号,从整体图像到对象框甚至分割掩模。我们的实验表明,我们的方法在单标签和多标签图像数据集上总是优于无指导的扩散模型,甚至可能超过基于基础真实标签的指导,特别是在不平衡数据上。
Oct, 2022
我们提出了一种简单高效的数据增强训练策略,通过插入适配器层来引导扩散模型仅专注于对象身份,使得我们的模型具备控制每个生成个性化对象的位置和大小的能力,并提出了区域引导抽样技术来保持生成图像的质量和保真度。
Jun, 2023