关于扩散概率模型的快速采样
Fast-DDPM 是一种简单而有效的方法,可同时提高训练速度、采样速度和生成质量,通过仅使用 10 个时间步进行训练和采样,相比 DDPM,Fast-DDPM 能够在医学图像生成任务中优于基于卷积网络和生成对抗网络的当前最先进方法,并将训练时间缩短了 5 倍,采样时间缩短了 100 倍。
May, 2024
FastDiff 是一种快速条件扩散模型,通过应用时间感知的位置可变卷积和噪声预测器,实现了高质量语音合成,并在端到端文本到语音合成中实现了高保真度的语音波形生成,速度快达 58 倍。
Apr, 2022
通过对 DDPM 模型进行简单修改,可以在保持高质量样本的同时达到具有竞争力的对数似然值,并学习反向扩散过程的方差,从而使用数量级更少的正向传递采样。使用精度和召回率比较 DDPM 和 GAN 模型的性能,并证明这些模型的样本质量和似然值可以与模型容量和训练计算平稳地提高。
Feb, 2021
通过提出一种新颖的去随机扩散过程,我们加速了离散扩散模型的算法;我们还引入了一种连续时间采样算法,能够比有限步长的离散时间采样算法提供更好的样本质量。大量实验表明,在自然语言生成和机器翻译任务中,我们的方法在离散扩散模型的生成速度和样本质量方面表现出优越性。
Dec, 2023
本文提出了一种基于扩散模型的统一条件框架,结合了轻量级 UNet 和固有的差异模型来增强图像恢复的物理约束,采用基本和集成模块实现了对所有块的引导和其他辅助条件信息的整合,并提出了简单而有效的截距补丁分裂策略,将其用于低光量去噪、去模糊和 JPEG 图像恢复的挑战任务中,得到了显著的感知质量提升和恢复任务的推广。
May, 2023
通过提出一个统一的采样框架(USF)研究求解器的可选策略,我们进一步揭示出采取不同的求解策略在不同的时间步骤可能有助于进一步减少截断误差,且精心设计的求解器计划有潜力在较大程度上提高样本质量。我们还提出了 $S^3,一个基于预测模型的搜索方法,可以自动优化求解器计划以获取更好的时间 - 质量权衡。通过对 CIFAR-10、CelebA、ImageNet 和 LSUN-Bedroom 数据集的实验证明,$S^3 能够找到优秀的求解器计划,在 10 次函数评估下实现了 2.69 的 FID,5 次函数评估下实现了 6.86 的 FID,明显优于现有方法。此外,我们还将 $S^3 应用于稳定扩散模型,获得了 2 倍的加速比,展示了在非常少的步骤中进行采样而无需重新训练神经网络的可行性。
Dec, 2023
利用连续动力系统设计一种新型去噪网络,以提高扩散模型的参数效率、收敛速度和噪声鲁棒性。与基准模型相比,该模型具有约四分之一的参数量和百分之三十的浮点操作数(FLOPs),推理速度提高了 70%,并且收敛到了更好的质量解。
Oct, 2023
本文提出了一种用于采样扩散概率模型的快速高阶求解器 DPM-Solver,并通过自适应求解扩散常微分方程,可在数百或数千步骤内使用较小的神经网络采样高质量样本,相比于以往方法有明显速度优势
Jun, 2022
通过将去噪步骤直接整合到模型的架构中,本研究提出了一种新方法,将扩散模型与生成对抗网络结合起来,通过知识蒸馏实现更高效的训练和评估,从而减少了所需的参数和去噪步骤,提高了测试时的采样速度。
May, 2024