本文提出了一种基于 Gamma 噪声的去噪扩散 Gamma 模型(DDGM),并通过图像和语音生成任务验证了其性能优于传统的基于高斯噪声的扩散模型。
Oct, 2021
利用 Gibbs 扩散(GDiff)方法,在参数化高斯噪声的假设下,提出了一种盲去噪的方法,通过一种条件扩散模型和蒙特卡洛采样器交替采样,可以推断出信号和噪声参数。
Feb, 2024
基于扩散模型的音频修复算法在语音增强和音乐修复任务中表现出色,既具有可解释性又具有出色的音质性能。
本文介绍了一种基于扩散模型的新型通用去噪扩散模型,采用线性插值进行扩散,中间的噪声图像从原始的清晰图像和相应的真实噪声图像进行插值,使得该扩散模型可以处理添加噪声的级别,并且提出了两种采样算法,实验证明该模型在真实去噪基准测试中表现良好。
May, 2023
通过在扩散模型中引入两个辨别器(扩散辨别器和频谱图辨别器),我们提出了一种音频合成模型,其在各项评估指标中均优于 FastSpeech2 和 DiffGAN-TTS,并通过结构相似性指数、梅尔倒谱失真、F0 均方根误差、短时客观可懂性、语音质量感知评估和主观平均意见得分等客观和主观度量对该模型进行了评估。
Aug, 2023
本综述为关于应用于计算机视觉的去噪扩散模型文章提供了全面的回顾,包括在领域中的理论和实际贡献,提供了三种通用扩散建模框架,并介绍了扩散模型与其他深度生成模型之间的关系,并引入了在计算机视觉中应用扩散模型的多个视角分类,最后,我们说明了离散模型的当前限制并预见了未来研究的一些有趣方向。
Sep, 2022
利用新颖的评分匹配损失,我们提出了一种基于粒子迭代方案的粒子去噪扩散取样器(PDDS),它能够在温和假设下提供渐近一致的估计,我们在多模态和高维取样任务上演示了 PDDS。
通过对 DDPM 模型进行简单修改,可以在保持高质量样本的同时达到具有竞争力的对数似然值,并学习反向扩散过程的方差,从而使用数量级更少的正向传递采样。使用精度和召回率比较 DDPM 和 GAN 模型的性能,并证明这些模型的样本质量和似然值可以与模型容量和训练计算平稳地提高。
Feb, 2021
该研究论文提出了一种基于扩散模型的合成逼真噪声的新方法,用于为困难获得真实数据的情景下的训练去噪模型提供大量高质量的数据,并在多个基准测试上证明了其方法的优越性.
提出了一种称为重建生成扩散模型 (RnG) 的新方法,该方法利用重建去噪网络恢复绝大部分底层干净信号,并采用扩散算法生成剩余的高频细节,从而提高视觉质量和感知度。通过在合成和真实去噪数据集上进行广泛实验验证了该方法的优越性。
Sep, 2023