学习离散去噪扩散 ODEs
该研究提出了一种新的改进方法,通过最小化高保真图像生成中的采样误差,建立了一种针对传播概率模型的新的快速 ODE 求解器 DPM-Solver-v3,并通过引入一些在预训练模型上高效计算的系数,提高了样本质量。
Oct, 2023
通过设计一个优化问题,并使用约束信任区域方法,我们提出了一种针对特定数值 ODE 解算器的扩散概率模型 (DPMs) 寻找更合适的时间步长的通用框架,该框架能显著改善图像生成性能。
Feb, 2024
本文介绍了直接去噪扩散模型(DDDM):一种生成逼真图像的简单且通用方法,具有少步采样的特点,同时保留了多步采样以获得更好的性能。DDDM 不需要精心设计的采样器或预训练的蒸馏模型,而是以自身的先前训练迭代生成的估计目标为条件进行扩散模型的训练,通过考虑前一时间步生成的样本来引导迭代生成过程。我们还提出了 Pseudo-LPIPS,一种对各种超参数值更鲁棒的新型度量损失。尽管简单,该方法在基准数据集上表现出强大的性能。我们的模型在 CIFAR-10 上分别以一步采样和两步采样的 FID 分数为 2.57 和 2.33,超越了 GAN 和蒸馏基模型获得的分数。通过将采样扩展到 1000 步,我们将 FID 分数进一步降低到 1.79,与文献中的最先进方法相一致。在 ImageNet 64x64 上,我们的方法与主要模型相当。
May, 2024
提出了一种动态规划算法,基于 ELBO 分解原理,可用于任何预先训练的 DDPM,通过优化推理时间表来发现最优的离散时间表,从而实现生成速度与样本质量之间的平衡。
Jun, 2021
本文提出了一种用于采样扩散概率模型的快速高阶求解器 DPM-Solver,并通过自适应求解扩散常微分方程,可在数百或数千步骤内使用较小的神经网络采样高质量样本,相比于以往方法有明显速度优势
Jun, 2022
通过提出一个统一的采样框架(USF)研究求解器的可选策略,我们进一步揭示出采取不同的求解策略在不同的时间步骤可能有助于进一步减少截断误差,且精心设计的求解器计划有潜力在较大程度上提高样本质量。我们还提出了 $S^3,一个基于预测模型的搜索方法,可以自动优化求解器计划以获取更好的时间 - 质量权衡。通过对 CIFAR-10、CelebA、ImageNet 和 LSUN-Bedroom 数据集的实验证明,$S^3 能够找到优秀的求解器计划,在 10 次函数评估下实现了 2.69 的 FID,5 次函数评估下实现了 6.86 的 FID,明显优于现有方法。此外,我们还将 $S^3 应用于稳定扩散模型,获得了 2 倍的加速比,展示了在非常少的步骤中进行采样而无需重新训练神经网络的可行性。
Dec, 2023
Fast-DDPM 是一种简单而有效的方法,可同时提高训练速度、采样速度和生成质量,通过仅使用 10 个时间步进行训练和采样,相比 DDPM,Fast-DDPM 能够在医学图像生成任务中优于基于卷积网络和生成对抗网络的当前最先进方法,并将训练时间缩短了 5 倍,采样时间缩短了 100 倍。
May, 2024
提出了一种适用于扩散概率模型的高效取样器,通过引入分数积分解算器和递归导数估计方法,实现了具有收敛性保证的高效取样算法,与现有的无需预训练的取样算法相比,在离散时间和连续时间的扩散概率模型上取得了最先进的取样性能。
Aug, 2023
本文提出了一种基于伪数值方法的去噪扩散概率模型 (Pseudo numerical methods for Diffusion Models, PNDMs) 来加速 DDPM 的推断过程,此方法不仅在保持采样质量的同时能够实现高速加速,可以在仅进行 50 个步骤的情况下生成高质量的合成图像,相对于其他加速方法具有更好的表现。
Feb, 2022
本文提出了一种名为 DDM 的扩散模型,通过将复杂的扩散过程分解为两个相对简单的过程,来提高生成效果和速度,它通过显式转移概率近似图像分布,并通过标准维纳过程控制噪声路径;文章还提出了一个新的 DPM 训练目标,能够分别预测噪声和图像成分,同时,DDM 的逆向去噪公式可以自然地支持少数的生成步骤(不需要基于 ODE 的加速器),实验结果表明,DDM 在更少的函数评估方面优于以前的 DPM。
Jun, 2023