异形山谷:扩散模型的全面分析
本综述主要介绍了最近视觉领域中扩散模型的进展,特别是那些影响扩散模型计算效率的重要设计方面,重点是强调了最近提出的设计选择,这些选择导致更高效的扩散模型。
Oct, 2022
本篇论文提出了一种基于 DDPM 的新型框架,用于语义图像合成,通过条件扩散模型来处理语义布局与噪声图像,而引入分类器自由的引导采样策略来进一步提高了生成质量和语义可解释性。
Jun, 2022
本综述为关于应用于计算机视觉的去噪扩散模型文章提供了全面的回顾,包括在领域中的理论和实际贡献,提供了三种通用扩散建模框架,并介绍了扩散模型与其他深度生成模型之间的关系,并引入了在计算机视觉中应用扩散模型的多个视角分类,最后,我们说明了离散模型的当前限制并预见了未来研究的一些有趣方向。
Sep, 2022
通过对 DDPM 模型进行简单修改,可以在保持高质量样本的同时达到具有竞争力的对数似然值,并学习反向扩散过程的方差,从而使用数量级更少的正向传递采样。使用精度和召回率比较 DDPM 和 GAN 模型的性能,并证明这些模型的样本质量和似然值可以与模型容量和训练计算平稳地提高。
Feb, 2021
扩展前述的隐式条件方法,我们提出了一种新的框架,通过动态步长计算、无噪声缩放输入和潜在空间投影的方式增强了扩散模型的能力,有效地定位异常并在两个著名异常检测数据集上取得了最先进的性能。
Jan, 2024
利用连续动力系统设计一种新型去噪网络,以提高扩散模型的参数效率、收敛速度和噪声鲁棒性。与基准模型相比,该模型具有约四分之一的参数量和百分之三十的浮点操作数(FLOPs),推理速度提高了 70%,并且收敛到了更好的质量解。
Oct, 2023
通过使用随机上下文模型(SCMs)产生训练数据,首次对 Denoising Diffusion Probabilistic Models(DDPMs)在医学成像领域相关信息学习能力进行了系统评估,结果表明 DDPMs 在生成具有空间上下文的图像方面具有显著的能力,可能在数据增强任务中具有 GANs 所不能达到的优势。
Sep, 2023
通过研究噪声计划对扩散模型的影响,我们提出了两种确定给定图像集合的合理噪声范围的技术,并设计了一种新的参数化噪声计划,以获得更好的合理性。将此噪声计划应用于已知的扩散模型 EDM 的训练和采样,并将其与默认噪声计划进行比较,结果显示我们的计划将可行设计从 83.4%提高到 93.5%,Fréchet Inception Distance(FID)从 7.84 降低到 4.87。进一步的高级图像编辑工具应用证明了该模型对结构的良好理解。
Nov, 2023
通过使用特定类型的扩散模型(DDPM)在合成孔径雷达(SAR)领域实现有条件和无条件图像生成,本研究表明 DDPM 在质量上以及定性和定量效果上都优于现有的基于 GAN 的方法,并展示了预训练对于提高 SAR 图像生成质量的益处。
May, 2024