扩散模型对抗生成网络 (GANs) 在图像合成方面占优
本研究使用大规模的文本到图像扩散模型对分类条件模型进行微调,进而在 ImageNet 分类准确性得分上实现了显著的提升,证明了利用自然图像模型进行生成数据增强的可行性。
Apr, 2023
通过级联扩散模型和条件增强,我们成功的在 class-conditional ImageNet generation benchmark 上生成了高保真图像,并取得了优越的 FID scores 和分类精度。
May, 2021
本文探讨了使用一种单一的预训练阶段进行生成性和判别性任务的统一表征学习器 —— 扩散模型,并发现这种模型在图像分类任务中具有优异的性能,特别是在经过精心特征选择和池化的情况下,扩散模型明显优于 BigBiGAN 等其他可比较的生成 - 判别方法
Jul, 2023
本文使用受非平衡热力学考虑的潜变量模型 —— 扩散概率模型,提出了高质量的图像合成结果。通过根据扩散概率模型和 Langevin 动力学的去噪得分匹配之间的新颖联系设计加权变分界限进行训练,获得了最佳结果;此外,我们的模型自然地采用渐进式有损解压缩方案,可以解释为自回归解码的一般化。在无条件的 CIFAR10 数据集上,我们获得了 9.46 的 Inception 得分和 3.17 的最先进的 FID 得分。在 256x256 LSUN 上,我们获得了与 ProgressiveGAN 相似的样本质量。
Jun, 2020
通过 FineDiffusion 参数优化策略和基于超类条件引导的采样方法,在大规模细粒度图像生成中实现高效训练和减小存储开销,生成 10,000 个类别的图像并达到最新 FID 指标。
Feb, 2024
我们提出了一种设计空间,清晰地分离具体的设计选择,从采样和训练过程以及得分网络的预处理中识别了几个变化。通过改进,我们以比之前的设计更快的采样速度(每张图像 35 个网络评估)在条件设置下获得了 1.79 FID,无条件设置下获得了 1.97 FID,达到了新的最先进水平。
Jun, 2022
我们提出了一种方法将复杂的多步扩散模型提炼为单步有条件生成对抗网络学生模型,从而大大加速推理过程,同时保持图像质量。我们的方法将扩散提炼解释为一种对应的图像到图像转换任务,使用扩散模型 ODE 轨迹的噪声到图像对。为了进行高效的回归损失计算,我们提出了一种在扩散模型的潜空间中直接操作的感知损失 E-LatentLPIPS,利用增强的集合。此外,我们改进了扩散模型,构建了一个多尺度鉴别器,具有文本对齐损失,建立了一种有效的基于条件生成对抗网络的公式。即使考虑到数据集构建成本,E-LatentLPIPS 也比许多现有的提炼方法更高效。我们证明我们的一步生成器在零样本 COCO 基准测试上优于最先进的一步扩散提炼模型 - DMD、SDXL-Turbo 和 SDXL-Lightning。
May, 2024
本文提出了一种基于多模式条件 GAN,使其具有高样本质量、高模式覆盖和快速采样三个特性的去噪扩散生成对抗网络,同时在 CIFAR-10 数据集上比原扩散模型快 2000 倍,并且是第一种将采样成本降至足够低以便于应用于实际应用的模型。
Dec, 2021
本研究使用 BRATS20 和 BRATS21 数据集,对比了 StyleGAN 和扩散模型中合成的脑肿瘤图像与所有训练图像之间的相关性,结果表明扩散模型更容易记忆训练图像,因此在医学影像等领域应谨慎使用。
May, 2023