操作员提示的分数匹配用于马尔可夫扩散模型
本文提出了一种统一的视角来描述和设计基于最小Stein距离的估计器,并使用这种方法来设计新的扩散核Stein距离(DKSD)和扩散分数匹配(DSM)估计器,证明了它们的一致性、渐近正常性和鲁棒性,并为它们的高效优化推导了随机黎曼梯度下降算法。该方法的主要优势在于其灵活性,使我们能够通过仔细选择Stein距离来为特定的模型设计具有理想性质的估计器,并在一些具有挑战性的问题上进行了演示,例如光滑、重尾或轻尾密度的分数匹配。
Jun, 2019
通过分析神经网络的数学框架和得分匹配与回归分析之间的创新连接,本文提出了第一次得分函数学习的一般化误差(样本复杂性)边界,从而克服了观测值中存在噪声的问题。
Jan, 2024
该篇论文是一篇关于基于分数的扩散模型的阐述性文章,重点介绍了通过随机微分方程(SDE)进行公式化。在温和的引言后,讨论了扩散建模的两个支柱——抽样和得分匹配,其中包括SDE/ODE抽样,得分匹配效率,一致模型和强化学习。通过简短的证明来说明所述结果的主要思想。本文主要是为初学者介绍该领域,从中的分析对于设计新模型或算法的从业者也有一定的实用价值。
Feb, 2024
通过解决数值上求解对数密度福克-普朗克方程以在训练之前计算分数来提高基于分数的扩散模型的训练效率,并将预先计算的分数嵌入到图像中以加快训练速度和减少图像数来学习准确分数,我们在数值实验中展示了我们提出方法相对于标准基于分数的扩散模型的改进性能,其意义上地以更快速度实现了类似的质量。
Apr, 2024
本研究介绍了一种基于扩散过程的可逆学习方法,其核心在于学习其评分形式,用于估计科学系统的性质。我们引入一系列可计算的去噪评分匹配目标,称为局部-DSM,利用扩散过程的局部增量。我们展示了如何使用局部-DSM和泰勒展开进行自动训练和评分估计,用于非线性扩散过程。为了证明这些想法,我们使用自动-DSM在具有挑战性的低维分布和CIFAR10图像数据集上训练生成模型。此外,我们使用自动-DSM学习了在统计物理学中研究的非线性过程的评分。
Jul, 2024
本研究解决了得分匹配在高维数据生成中的理论不足,提出了一种新的最优得分估计方法,建立了光滑密度函数的尖锐最小最大估计速率。研究结果表明,生成的样本分布能够以最优速率逼近真实分布,显著提升了得分匹配模型的理论基础。
Sep, 2024
本研究解决了离散状态扩散模型收敛性分析的不足之处,提出了一种基于连续时间马尔可夫链框架的离散时间采样算法。研究表明,在特定假设下,生成的样本分布与数据分布之间的Kullback-Leibler散度和总变差距离的收敛边界几乎线性依赖于维度d,具有重要的理论价值和实用意义。
Oct, 2024