本文使用受非平衡热力学考虑的潜变量模型 —— 扩散概率模型,提出了高质量的图像合成结果。通过根据扩散概率模型和 Langevin 动力学的去噪得分匹配之间的新颖联系设计加权变分界限进行训练,获得了最佳结果;此外,我们的模型自然地采用渐进式有损解压缩方案,可以解释为自回归解码的一般化。在无条件的 CIFAR10 数据集上,我们获得了 9.46 的 Inception 得分和 3.17 的最先进的 FID 得分。在 256x256 LSUN 上,我们获得了与 ProgressiveGAN 相似的样本质量。
Jun, 2020
我们提出了一种设计空间,清晰地分离具体的设计选择,从采样和训练过程以及得分网络的预处理中识别了几个变化。通过改进,我们以比之前的设计更快的采样速度(每张图像 35 个网络评估)在条件设置下获得了 1.79 FID,无条件设置下获得了 1.97 FID,达到了新的最先进水平。
Jun, 2022
对于扩散模型的准确性进行了理论研究,通过梯度下降方法对去噪积分评分匹配的训练和采样过程进行了非渐近收敛分析,并提供了方差爆炸模型的抽样误差分析。通过这两个结果的结合,明确了如何设计有效生成的训练和采样过程。
Jun, 2024
本研究提出了一种名为去噪扩散算子的数学严谨框架,用于在函数空间中训练扩散模型,将它推广到无限维函数空间的应用,其中前向过程是逐渐扰动输入函数,生成过程是通过积分的函数值 Langevin 动力学实现。
Feb, 2023
本文通过使用扩散生成模型,将自编码器与基于分数的解码器相结合的简单但理论上有动机的两阶段方法,实现了在给定比特率时提高视觉质量,并在 FID 分数上跑赢了最先进的方法 PO-ELIC 和 HiFiC。
May, 2023
本文通过导出一个变分框架来推导连续时间生成扩散理论,并表明该理论中最小化匹配得分损失等价于最大化该理论内所提出的可逆 SDE 插件的似然度的下限。
Jun, 2021
本文研究使用基于得分的扩散模型进行深层生成建模的方法,系统比较和理论分析不同方法学习条件概率分布的效果,并证明得出条件得分最成功的估计器的理论依据。同时,介绍了多速度扩散框架,提出了一个新的条件分数估计器,与之前的最先进方法相当。伴随着本文的理论和实验研究是一个开放源代码库 MSDiff,可用于应用和进一步研究多速度扩散模型。
Nov, 2021
该研究提出了一种使用分数梯度模型重构图像的方法,并使用连续时间依赖分数函数进行训练。该模型可用于解决成像的反问题,尤其是加速 MRI,具有强大的性能及实用性,并且可重构复杂值数据。
Oct, 2021
通过在模型训练过程中加入约束条件使其生成的样本更符合所施加的约束,从而提高生成样本与约束的一致性,且相较于现有方法有更好的性能且不影响推断速度;该方法还可以自然地防止过拟合。
Mar, 2024
本研究通过设计独特的系数,首次理论证明了去噪扩散概率模型可以适应目标分布中未知的低维结构,凸显了系数设计的重要性。
May, 2024