离散扩散模型的收敛分析:通过均一化实现精确实施
该研究提出了第一个完整的离散数据扩散模型去噪声的连续时间框架,使用连续时间马尔可夫链模型可以有效地训练模型,利用高维 CTMC 模拟技术和连续时间框架可导出高性能抽样器,超越了离散时间方法。此外,还得到了关于生成样本分布与真实数据分布之间误差的新理论结果。
May, 2022
该研究发展了一套用于理解离散时间下扩散模型数据生成过程的非渐进理论,对于一种常见的确定性采样方法,该理论建立了一个与步骤总数$T$成反比例的收敛速率,对于另一种主流随机采样方法,该理论得出了一个与步骤总数$T$的平方根成反比例的收敛速率,同时设计了两种加速变体,进一步提高了收敛速度。
Jun, 2023
通过提出一种新颖的去随机扩散过程,我们加速了离散扩散模型的算法;我们还引入了一种连续时间采样算法,能够比有限步长的离散时间采样算法提供更好的样本质量。大量实验表明,在自然语言生成和机器翻译任务中,我们的方法在离散扩散模型的生成速度和样本质量方面表现出优越性。
Dec, 2023
提出了一种用于简化离散扩散的数学简化方案,同时还提出了一种能够精确和加速采样的简单公式,并通过创建一个统一的模型,简化离散扩散的前向和后向概率计算,取得了在现有数据集上优于其他方法的效果。
Feb, 2024
去噪扩散模型是一种将噪声转换为数据的强大生成技术,本论文研究了离散时间扩散模型在更大范围的分布上的收敛性保证,并提出了一种加速采样器来提高收敛速度和维度依赖性。
Feb, 2024
本文提出了一种离散状态连续时间设置的图扩散生成模型,该模型在以前的图扩散模型中从未被研究过。分析表明,我们的训练目标与生成质量密切相关,我们提出的生成框架在节点排序的排列方面具有理想的不变/等变特性。我们的模型在各种基准测试中表现出有竞争力的实证性能,同时在采样阶段可以在生成质量和效率之间灵活权衡。
May, 2024
本研究解决了扩散模型在生成建模中的收敛问题,提出了一种基于基本非渐近方法的概率流常微分方程采样器的收敛理论。研究表明,在满足最小假设条件下,使用$ \ell_2 $精确估计的Stein得分函数,经过$d/\varepsilon$次迭代即可将目标分布近似至$\varepsilon$的全变差距离,显著提高了对数据生成过程的理解。
Aug, 2024
本研究解决了离散状态扩散模型收敛性分析的不足之处,提出了一种基于连续时间马尔可夫链框架的离散时间采样算法。研究表明,在特定假设下,生成的样本分布与数据分布之间的Kullback-Leibler散度和总变差距离的收敛边界几乎线性依赖于维度d,具有重要的理论价值和实用意义。
Oct, 2024
本研究针对扩散模型在收敛性分析上的理论与实践之间的差距进行探讨,提出了一种新的迭代复杂度 $d^{1/3}\varepsilon^{-2/3}$,优于之前已知的最佳复杂度 $d^{5/12}\varepsilon^{-1}$。通过随机中点方法,这项研究为扩散模型提供了收敛性分析,并能在无对数凹性的限制下,实现高效的并行运算。
Oct, 2024