Mar, 2024

软约束薛定谔桥:一种随机控制方法

TL;DR通过允许终端分布与 μ_T 不同,但惩罚两个分布之间的 Kullback-Leibler 散度,我们提出了一种软约束的 Schrödinger bridge(SSB)的最优控制方法,并且从理论上推导了其解决方案,表明最优控制过程的终端分布是 μ_T 和其他分布的几何混合,该结果进一步应用于时间序列设置,并提出了鲁棒性生成扩散模型的应用。我们提出了一种基于评分匹配的算法,用于从几何混合中进行采样,并通过对 MNIST 数据集的数值实例展示其用途。