扩散模型的泛化特性研究

Nov, 2023

On the Generalization Properties of Diffusion Models

Puheng Li, Zhong Li, Huishuai Zhang, Jiang Bian

TL;DR扩散模型在理论和实践中的广义化能力、一般化差距以及模型对模式变化的敏感性进行了全面的理论分析和定量分析，证明了其在样本大小和模型容量上具有多项式级别的小一般化误差，使得其非常适用于实际应用。

Abstract

diffusion models are a class of generative models that serve to establish a stochastic transport map between an empirically observed, yet unknown, target distribution and a known prior. Despite their remarkable success in real-world applications, a theoretical understanding of their

diffusion models generalization capabilities generalization gap score-based diffusion models modes shift

发现论文，激发创造

扩散模型的泛化性

通过定义通用性测量，本文研究了扩散概率生成模型的泛化能力。我们发现确定性采样器生成的数据与训练集高度相关，因此泛化能力差。通过实验，我们验证了足够训练的扩散模型与经验最优解之间的微小区别对于模型具有关键性影响，并提出了另一个无潜在泛化问题的训练目标，该目标返回与原模型类似的模型，从而验证了训练扩散模型的泛化能力。

May, 2023

概率扩散模型讲义

扩散模型通过训练大量数据点，利用逐渐添加随机噪声和逆扩散过程将数据样本从复杂分布转换为简单分布，并学习数据流形，优于其他方法（包括生成对抗网络）来建模自然图像等分布。

Dec, 2023

构建桥梁：理解和扩展扩散生成模型

本研究重新考虑扩散模型的总体框架，将其视为具有未观察到扩散轨迹的潜在变量模型，并应用于数据不受限制的领域。利用最大似然估计，我们表明模型构建和潜在路径的插补都可以构造扩散桥过程，实现端点的确定值和约束条件，并提供一套系统的研究和工具，进而提出了学习扩散生成模型的第一个理论误差分析和学习不同离散和受限领域数据的简单而统一的方法。实验证明，我们的方法在生成图像、语义分段和 3D 点云方面表现出色。

Aug, 2022

扩散模型概述：应用、引导生成、统计速率和优化

扩散模型是强大且通用的生成式人工智能技术，在计算机视觉、音频、强化学习和计算生物学等领域取得了巨大的成功。本文回顾了扩散模型的新兴应用，理解了它们在各种控制下的样本生成。同时，我们概述了现有的扩散模型理论，涵盖了它们的统计性质和采样能力。进一步地，我们评述了通过条件扩散模型进行高维结构化优化的新途径，将解决方案的搜索重新定义为条件采样问题，并通过扩散模型进行求解。最后，我们讨论了扩散模型的未来发展方向。本文旨在为刺激前瞻性的扩散模型理论和方法提供全面的理论介绍。

Apr, 2024

生成式扩散模型的理论研究综述

生成扩散模型的理论发展主要分为两种方法，基于训练和基于采样，将这些方法明确分类为研究者未来进行新发展提供清晰可理解的方向。

Apr, 2024

广义概率扩散尺度空间

通过提出概率扩散模型的广义尺度空间理论，我们揭示了这些模型与经典图像滤波的关联，并展示了与扩散和渗透滤波的概念和经验上的联系。

Sep, 2023

时间序列应用的扩散模型：一项调查

本篇综述着重探讨了基于扩散模型的时间序列预测、插补和生成方法，并比较了不同应用的方法及其联系，最后总结了现有的限制与未来的发展方向。

May, 2023

重正化扩散模型

使用扩散模型学习统计场论和量子场论的逆重整化群流。

Aug, 2023

扩散模型：方法和应用综述

本文概述了 “扩散模型” 在图像合成、视频生成、分子设计等领域中的应用，并将相关研究分为三大类：高效采样、改进似然估计和处理具有特殊结构的数据。此外，还探讨了将扩散模型与其他生成模型相结合以获得更好结果的潜能，在计算机视觉、自然语言生成、时态数据模型等领域具有广泛的应用。本文旨在提供一个全面的扩散模型综述，指出其重点研究领域并指向未来的研究方向。

Sep, 2022

基于扩散的生成模型的更快非渐进收敛探索

该研究发展了一套用于理解离散时间下扩散模型数据生成过程的非渐进理论，对于一种常见的确定性采样方法，该理论建立了一个与步骤总数 $T$ 成反比例的收敛速率，对于另一种主流随机采样方法，该理论得出了一个与步骤总数 $T$ 的平方根成反比例的收敛速率，同时设计了两种加速变体，进一步提高了收敛速度。

Jun, 2023