小波扩散模型:快速可扩展的图像生成器
该论文介绍了一种使用预训练自编码器将图像压缩为紧凑的潜在空间的潜隐去噪扩散生成对抗网络(LDDGAN),以显著提高推断速度和图像质量,并提出了一种加权学习策略来增强多样性和图像质量。该模型在 CIFAR-10,CelebA-HQ 和 LSUN-Church 数据集上的实验结果证明了其在扩散模型中达到了最先进的运行速度。与其前身 DiffusionGAN 和 Wavelet Diffusion 相比,我们的模型在所有评估指标上都表现出了显著的改进。
Jun, 2024
我们提出了一种名为 DiffLL 的稳健和高效的基于扩散模型的低光图像增强方法,它利用波浪变换加速推理并降低计算资源使用但不损失信息,并通过前向扩散和反向去噪实现稳定去噪和减少随机性。我们还设计了高频率恢复模块,利用图像的垂直和水平细节来补充对角信息以实现更好的细粒度恢复。大量实验证明,我们的方法在定量和视觉上均优于现有的最先进方法,并且与以前的扩散方法相比,在效率上获得了显着的提高。此外,我们还经验性地证明了方法在低光人脸检测方面的潜在实际价值。
Jun, 2023
通过 Wavelet-Based Diffusion Model 和 Efficient Conditional Sampling,本研究提出了一种更加高效的图像恢复方法,其速度可以达到传统方法的 100 倍以上,并在四个基准数据集上实现了最先进的性能。
May, 2023
通过将扩散模型推广到旋转坐标系并引入模糊扩散,本文提出了一种新的粗到细的图像生成过程,以此来考虑图像中不同频率的相对重要性,实验结果表明此方法在 LSUN 卧室和教堂数据集上的成果优于之前的方法。
Jul, 2022
本文探讨了使用一种单一的预训练阶段进行生成性和判别性任务的统一表征学习器 —— 扩散模型,并发现这种模型在图像分类任务中具有优异的性能,特别是在经过精心特征选择和池化的情况下,扩散模型明显优于 BigBiGAN 等其他可比较的生成 - 判别方法
Jul, 2023
一项名为 SWORD(Stage-by-stage Wavelet Optimization Refinement Diffusion)模型的创新性方法被提出,用于稀疏视图 CT 重建。该方法结合了低频和高频生成模型,通过优化过程实现解决方案。实验证明,该方法在定量和定性方面均优于现有的先进方法。
Aug, 2023
本文提出了一种基于多模式条件 GAN,使其具有高样本质量、高模式覆盖和快速采样三个特性的去噪扩散生成对抗网络,同时在 CIFAR-10 数据集上比原扩散模型快 2000 倍,并且是第一种将采样成本降至足够低以便于应用于实际应用的模型。
Dec, 2021
在这篇文章中,我们发现了扩散模型生成质量受到迭代次数限制的根本原因,并提出了一个简单而有效的解决方案来缓解这些影响。我们的解决方案可以应用于任何现有的扩散模型,并且在各种 SOTA 体系结构上运行多个数据集和配置进行实验和详尽的消融研究,证明能够立即提高它们的生成质量。
Mar, 2022