Beta抽样即所需:利用逐步谱分析的扩散模型高效图像生成策略
通过将扩散模型推广到旋转坐标系并引入模糊扩散,本文提出了一种新的粗到细的图像生成过程,以此来考虑图像中不同频率的相对重要性,实验结果表明此方法在 LSUN 卧室和教堂数据集上的成果优于之前的方法。
Jul, 2022
本文研究了扩散模型中存在的曝光偏差,并提出了一种名为 Time-Shift Sampler 的推理方法,该方法可以在不重新训练模型的情况下缓解曝光偏差,并通过实验结果证明了其有效性。
May, 2023
本文介绍了一种新的方法ParaDiGMS,通过并行执行多个去噪步骤来加速预训练扩散模型的采样速度。该方法通过使用Picard迭代猜测未来去噪步骤的解,并迭代地进行加工,从而使扩散采样过程可以并行化,使计算机可用性更高。使用ParaDiGMS,各种机器人和图像生成模型的采样速度提高2-4倍,无论对任务奖励、FID分数、还是CLIP分数都没有任何可感知的退化。
May, 2023
本文提出了一种名为DDM的扩散模型,通过将复杂的扩散过程分解为两个相对简单的过程,来提高生成效果和速度,它通过显式转移概率近似图像分布,并通过标准维纳过程控制噪声路径;文章还提出了一个新的DPM训练目标,能够分别预测噪声和图像成分,同时,DDM的逆向去噪公式可以自然地支持少数的生成步骤(不需要基于ODE的加速器),实验结果表明,DDM在更少的函数评估方面优于以前的DPM。
Jun, 2023
引入了β扩散的新型生成建模方法,结合去掩码和去噪的技术在有限范围内生成数据;将缩放和平移的贝塔分布与乘法转换结合使用,通过时间来创建正向和反向扩散过程,在任意时间点给定数据条件下维持正向边缘分布和反向条件分布;该方法优化KL散度上界,表明KL散度的两个参数互换时所得到的KL散度的负下界不如优化后的KL散度上界效果好;β扩散的损失函数以Bregman散度表示,进一步支持用KL散度上界进行优化;在合成数据和自然图像上的实验结果验证了β扩散在范围受限生成建模方面的独特能力,证实了KL散度上界在优化扩散模型方面的有效性,从而成为扩散式生成模型和训练它们所使用的优化技术中的有价值补充。
Sep, 2023
通过实施分布匹配蒸馏(Distribution Matching Distillation)以及多步扩散输出的大规模结构简单回归损失相匹配的方法,我们将扩散模型转化为一步图像生成器,以显著降低对图像质量的影响,使其在ImageNet 64x64上达到2.62 FID,在无监督COCO-30k上达到11.49 FID,并可通过FP16推理在现代硬件上以20 FPS生成图像。
Nov, 2023
本文介绍了一种通过扩展扩散模型进行图像修复的新方法,该方法利用生成过程中与测量身份一致的样本,并结合测量信号与初始化信息来提高生成过程的效果。实验证明了该方法在不同的图像修复任务中的有效性。
Feb, 2024
通过设计一个优化问题,并使用约束信任区域方法,我们提出了一种针对特定数值ODE解算器的扩散概率模型(DPMs)寻找更合适的时间步长的通用框架,该框架能显著改善图像生成性能。
Feb, 2024
该研究论文提出了一种名为MASF的新方法,通过在频域内对不同频率分量进行移动平均来解决扩散模型在图像生成中的去噪不稳定性问题,实验结果表明,MASF相较于基准方法具有卓越的性能和可扩展性。
Mar, 2024
该研究解决了扩散模型在取样速度上存在的瓶颈,通过提出一种新的框架,能够自适应地分配计算资源以估计得分,从而减少整体取样时间。研究发现,得分估计所需的计算量会随着时间步变化,提出的早期退出策略能够在不影响图像质量的前提下显著提高取样吞吐量。
Aug, 2024