本文介绍了一种基于扩散模型的新型通用去噪扩散模型,采用线性插值进行扩散,中间的噪声图像从原始的清晰图像和相应的真实噪声图像进行插值,使得该扩散模型可以处理添加噪声的级别,并且提出了两种采样算法,实验证明该模型在真实去噪基准测试中表现良好。
May, 2023
本文提出了一种基于多模式条件 GAN,使其具有高样本质量、高模式覆盖和快速采样三个特性的去噪扩散生成对抗网络,同时在 CIFAR-10 数据集上比原扩散模型快 2000 倍,并且是第一种将采样成本降至足够低以便于应用于实际应用的模型。
Dec, 2021
近年来,深度学习模型成功应用于增强低分辨率宇宙学模拟的小尺度信息,称为 “超分辨”。我们引入去噪扩散模型作为一种强大的生成模型,用于超分辨宇宙大尺度结构预测(首次在二维中作为概念验证)。通过开发一种新的 “滤波增强” 训练方法,重分配了像素级训练目标中不同尺度的重要性,以获得准确的小尺度结果。我们证明了我们的模型不仅能够产生令人信服的超分辨图像和功率谱,保持百分位水平的一致性,还能够重现与给定低分辨率模拟一致的小尺度特征的多样性,这对于这种超分辨模型作为宇宙结构形成的替代模型的有效性来说至关重要。
Oct, 2023
提出了一种称为重建生成扩散模型 (RnG) 的新方法,该方法利用重建去噪网络恢复绝大部分底层干净信号,并采用扩散算法生成剩余的高频细节,从而提高视觉质量和感知度。通过在合成和真实去噪数据集上进行广泛实验验证了该方法的优越性。
Sep, 2023
通过在模型训练过程中加入约束条件使其生成的样本更符合所施加的约束,从而提高生成样本与约束的一致性,且相较于现有方法有更好的性能且不影响推断速度;该方法还可以自然地防止过拟合。
Mar, 2024
在这篇文章中,我们发现了扩散模型生成质量受到迭代次数限制的根本原因,并提出了一个简单而有效的解决方案来缓解这些影响。我们的解决方案可以应用于任何现有的扩散模型,并且在各种 SOTA 体系结构上运行多个数据集和配置进行实验和详尽的消融研究,证明能够立即提高它们的生成质量。
Mar, 2022
本文旨在了解人们无法将由扩散模型产生的合成图像与原始图像区分开来的难度,并研究当前的最先进检测器是否适用于此任务。
Nov, 2022
本文提出一种简单而通用的学习方案,可针对任何给定步骤逐步调整噪声参数,从而显著提高类比扩散模型的综合结果。
Apr, 2021
通过在扩散模型中引入两个辨别器(扩散辨别器和频谱图辨别器),我们提出了一种音频合成模型,其在各项评估指标中均优于 FastSpeech2 和 DiffGAN-TTS,并通过结构相似性指数、梅尔倒谱失真、F0 均方根误差、短时客观可懂性、语音质量感知评估和主观平均意见得分等客观和主观度量对该模型进行了评估。
Aug, 2023
本综述为关于应用于计算机视觉的去噪扩散模型文章提供了全面的回顾,包括在领域中的理论和实际贡献,提供了三种通用扩散建模框架,并介绍了扩散模型与其他深度生成模型之间的关系,并引入了在计算机视觉中应用扩散模型的多个视角分类,最后,我们说明了离散模型的当前限制并预见了未来研究的一些有趣方向。
Sep, 2022