扩散高斯混合音频降噪

Jun, 2024

Diffusion Gaussian Mixture Audio Denoise

Pu Wang, Junhui Li, Jialu Li, Liangdong Guo, Youshan Zhang

TL;DR提出了一种 DiffGMM 模型，它是基于扩散和高斯混合模型的去噪模型。通过反向过程估计高斯混合模型的参数，从而近似真实噪声分布，并通过连续减去估计的噪声来输出清晰的音频信号。广泛的实验结果表明，所提出的 DiffGMM 模型达到了最先进的性能。

Abstract

Recent diffusion models have achieved promising performances in audio-denoising tasks. The unique property of the reverse process could recover clean signals. However, the distribution of real-world noises does n

audio-denoising diffgmm model diffusion gaussian mixture model noisy signal

发现论文，激发创造

去噪扩散伽马模型

本文提出了一种基于 Gamma 噪声的去噪扩散 Gamma 模型（DDGM），并通过图像和语音生成任务验证了其性能优于传统的基于高斯噪声的扩散模型。

Oct, 2021

傾聽噪音：基于吉布斯扩散的盲去噪

利用 Gibbs 扩散（GDiff）方法，在参数化高斯噪声的假设下，提出了一种盲去噪的方法，通过一种条件扩散模型和蒙特卡洛采样器交替采样，可以推断出信号和噪声参数。

Feb, 2024

音频修复的扩散模型

基于扩散模型的音频修复算法在语音增强和音乐修复任务中表现出色，既具有可解释性又具有出色的音质性能。

Feb, 2024

扩散模型实现实际噪声抑制

本文介绍了一种基于扩散模型的新型通用去噪扩散模型，采用线性插值进行扩散，中间的噪声图像从原始的清晰图像和相应的真实噪声图像进行插值，使得该扩散模型可以处理添加噪声的级别，并且提出了两种采样算法，实验证明该模型在真实去噪基准测试中表现良好。

May, 2023

使用双判别器对去噪扩散模型进行对抗训练的高保真多说话人 TTS

通过在扩散模型中引入两个辨别器（扩散辨别器和频谱图辨别器），我们提出了一种音频合成模型，其在各项评估指标中均优于 FastSpeech2 和 DiffGAN-TTS，并通过结构相似性指数、梅尔倒谱失真、F0 均方根误差、短时客观可懂性、语音质量感知评估和主观平均意见得分等客观和主观度量对该模型进行了评估。

Aug, 2023

视觉中的扩散模型：一项调研

本综述为关于应用于计算机视觉的去噪扩散模型文章提供了全面的回顾，包括在领域中的理论和实际贡献，提供了三种通用扩散建模框架，并介绍了扩散模型与其他深度生成模型之间的关系，并引入了在计算机视觉中应用扩散模型的多个视角分类，最后，我们说明了离散模型的当前限制并预见了未来研究的一些有趣方向。

Sep, 2022

粒子去噪扩散采样器

利用新颖的评分匹配损失，我们提出了一种基于粒子迭代方案的粒子去噪扩散取样器（PDDS），它能够在温和假设下提供渐近一致的估计，我们在多模态和高维取样任务上演示了 PDDS。

Feb, 2024

改进降噪扩散概率模型

通过对 DDPM 模型进行简单修改，可以在保持高质量样本的同时达到具有竞争力的对数似然值，并学习反向扩散过程的方差，从而使用数量级更少的正向传递采样。使用精度和召回率比较 DDPM 和 GAN 模型的性能，并证明这些模型的样本质量和似然值可以与模型容量和训练计算平稳地提高。

Feb, 2021

扩散模型实现逼真噪声合成

该研究论文提出了一种基于扩散模型的合成逼真噪声的新方法，用于为困难获得真实数据的情景下的训练去噪模型提供大量高质量的数据，并在多个基准测试上证明了其方法的优越性.

May, 2023

细节保留图像去噪的重建生成扩散模型

提出了一种称为重建生成扩散模型 (RnG) 的新方法，该方法利用重建去噪网络恢复绝大部分底层干净信号，并采用扩散算法生成剩余的高频细节，从而提高视觉质量和感知度。通过在合成和真实去噪数据集上进行广泛实验验证了该方法的优越性。

Sep, 2023