扩散模型的泛化特性研究
通过定义通用性测量,本文研究了扩散概率生成模型的泛化能力。我们发现确定性采样器生成的数据与训练集高度相关,因此泛化能力差。通过实验,我们验证了足够训练的扩散模型与经验最优解之间的微小区别对于模型具有关键性影响,并提出了另一个无潜在泛化问题的训练目标,该目标返回与原模型类似的模型,从而验证了训练扩散模型的泛化能力。
May, 2023
扩散模型通过训练大量数据点,利用逐渐添加随机噪声和逆扩散过程将数据样本从复杂分布转换为简单分布,并学习数据流形,优于其他方法(包括生成对抗网络)来建模自然图像等分布。
Dec, 2023
本研究重新考虑扩散模型的总体框架,将其视为具有未观察到扩散轨迹的潜在变量模型,并应用于数据不受限制的领域。利用最大似然估计,我们表明模型构建和潜在路径的插补都可以构造扩散桥过程,实现端点的确定值和约束条件,并提供一套系统的研究和工具,进而提出了学习扩散生成模型的第一个理论误差分析和学习不同离散和受限领域数据的简单而统一的方法。实验证明,我们的方法在生成图像、语义分段和 3D 点云方面表现出色。
Aug, 2022
扩散模型是强大且通用的生成式人工智能技术,在计算机视觉、音频、强化学习和计算生物学等领域取得了巨大的成功。本文回顾了扩散模型的新兴应用,理解了它们在各种控制下的样本生成。同时,我们概述了现有的扩散模型理论,涵盖了它们的统计性质和采样能力。进一步地,我们评述了通过条件扩散模型进行高维结构化优化的新途径,将解决方案的搜索重新定义为条件采样问题,并通过扩散模型进行求解。最后,我们讨论了扩散模型的未来发展方向。本文旨在为刺激前瞻性的扩散模型理论和方法提供全面的理论介绍。
Apr, 2024
本文概述了 “扩散模型” 在图像合成、视频生成、分子设计等领域中的应用,并将相关研究分为三大类:高效采样、改进似然估计和处理具有特殊结构的数据。此外,还探讨了将扩散模型与其他生成模型相结合以获得更好结果的潜能,在计算机视觉、自然语言生成、时态数据模型等领域具有广泛的应用。本文旨在提供一个全面的扩散模型综述,指出其重点研究领域并指向未来的研究方向。
Sep, 2022
该研究发展了一套用于理解离散时间下扩散模型数据生成过程的非渐进理论,对于一种常见的确定性采样方法,该理论建立了一个与步骤总数 $T$ 成反比例的收敛速率,对于另一种主流随机采样方法,该理论得出了一个与步骤总数 $T$ 的平方根成反比例的收敛速率,同时设计了两种加速变体,进一步提高了收敛速度。
Jun, 2023