扩散模型对抗生成网络 (GANs) 在图像合成方面占优

May, 2021

扩散模型对抗生成网络 (GANs) 在图像合成方面占优

Diffusion Models Beat GANs on Image Synthesis

Prafulla Dhariwal, Alex Nichol

TL;DR通过扩散模型和分类器引导，我们的图像合成方法在 FID 指标以及覆盖分布方面优于现有的生成模型，我们的代码开源。

Abstract

We show that diffusion models can achieve image sample quality superior to the current state-of-the-art generative models. We achieve this on unconditional image synthesis by finding a better architecture through

diffusion models image synthesis classifier guidance fid upsampling

发现论文，激发创造

扩散模型生成的合成数据提升 ImageNet 分类准确性

本研究使用大规模的文本到图像扩散模型对分类条件模型进行微调，进而在 ImageNet 分类准确性得分上实现了显著的提升，证明了利用自然图像模型进行生成数据增强的可行性。

Apr, 2023

级联扩散模型用于高保真图像生成

通过级联扩散模型和条件增强，我们成功的在 class-conditional ImageNet generation benchmark 上生成了高保真图像，并取得了优越的 FID scores 和分类精度。

May, 2021

扩散模型在图像分类上胜过 GAN

本文探讨了使用一种单一的预训练阶段进行生成性和判别性任务的统一表征学习器 —— 扩散模型，并发现这种模型在图像分类任务中具有优异的性能，特别是在经过精心特征选择和池化的情况下，扩散模型明显优于 BigBiGAN 等其他可比较的生成 - 判别方法

Jul, 2023

关于引导式扩散模型的精馏

本文介绍了一种将分类器自由引导扩散模型蒸馏为更快采样的方法，以减少推理时间，并取得了与原始模型相当的图像有效性。

Oct, 2022

去噪扩散概率模型

本文使用受非平衡热力学考虑的潜变量模型 —— 扩散概率模型，提出了高质量的图像合成结果。通过根据扩散概率模型和 Langevin 动力学的去噪得分匹配之间的新颖联系设计加权变分界限进行训练，获得了最佳结果；此外，我们的模型自然地采用渐进式有损解压缩方案，可以解释为自回归解码的一般化。在无条件的 CIFAR10 数据集上，我们获得了 9.46 的 Inception 得分和 3.17 的最先进的 FID 得分。在 256x256 LSUN 上，我们获得了与 ProgressiveGAN 相似的样本质量。

Jun, 2020

FineDiffusion：用于细粒度图像生成的扩展扩散模型，具备 10,000 个类别的规模

通过 FineDiffusion 参数优化策略和基于超类条件引导的采样方法，在大规模细粒度图像生成中实现高效训练和减小存储开销，生成 10,000 个类别的图像并达到最新 FID 指标。

Feb, 2024

扩散式生成模型设计空间的阐明

我们提出了一种设计空间，清晰地分离具体的设计选择，从采样和训练过程以及得分网络的预处理中识别了几个变化。通过改进，我们以比之前的设计更快的采样速度（每张图像 35 个网络评估）在条件设置下获得了 1.79 FID，无条件设置下获得了 1.97 FID，达到了新的最先进水平。

Jun, 2022

将扩散模型融合为条件生成对抗网络

我们提出了一种方法将复杂的多步扩散模型提炼为单步有条件生成对抗网络学生模型，从而大大加速推理过程，同时保持图像质量。我们的方法将扩散提炼解释为一种对应的图像到图像转换任务，使用扩散模型 ODE 轨迹的噪声到图像对。为了进行高效的回归损失计算，我们提出了一种在扩散模型的潜空间中直接操作的感知损失 E-LatentLPIPS，利用增强的集合。此外，我们改进了扩散模型，构建了一个多尺度鉴别器，具有文本对齐损失，建立了一种有效的基于条件生成对抗网络的公式。即使考虑到数据集构建成本，E-LatentLPIPS 也比许多现有的提炼方法更高效。我们证明我们的一步生成器在零样本 COCO 基准测试上优于最先进的一步扩散提炼模型 - DMD、SDXL-Turbo 和 SDXL-Lightning。

May, 2024

用去噪漂移 GAN 解决生成学习三难问题

本文提出了一种基于多模式条件 GAN，使其具有高样本质量、高模式覆盖和快速采样三个特性的去噪扩散生成对抗网络，同时在 CIFAR-10 数据集上比原扩散模型快 2000 倍，并且是第一种将采样成本降至足够低以便于应用于实际应用的模型。

Dec, 2021

针对合成医学影像的扩散模型应谨慎 -- 与 GAN 相比记忆脑肿瘤影像的能力比较

本研究使用 BRATS20 和 BRATS21 数据集，对比了 StyleGAN 和扩散模型中合成的脑肿瘤图像与所有训练图像之间的相关性，结果表明扩散模型更容易记忆训练图像，因此在医学影像等领域应谨慎使用。

May, 2023