潜空间中的流匹配
基于连续归一化流的生成建模范例中,发现使用流匹配方法与扩散路径一起训练更具有鲁棒性和稳定性,并且可以开启使用优化运输插值定义的非扩散概率路径,该方法比传统扩散模型更适用于训练 ImageNet,并能快速生成可靠采样结果。
Oct, 2022
本文提出了一种使用基于新颖潜在流扩散模型(LFDM)的方法,旨在从给定的图像和条件(例如笑容)中合成一个新的合理视频,该模型可以更好地综合空间细节和时间动作。
Mar, 2023
通过非简单合并数据和噪声样本的 Multisample Flow Matching 算法,我们可以在完全不需要模拟的情况下,通过一个简单的最小化目标函数构造概率路径,实现连续时间生成模型训练参数、生成高质量样本和高维传输映射等目标的综合优化。
Apr, 2023
通过流匹配和变压器(U-ViT)的结合,实现了简单高效的图像编辑方法,大大提高了生成模型的可扩展性和性能,并提供了对潜在结构和编辑能力的探索。通过引入一个名为$u$-space的编辑空间以及针对ODE求解器的适应性抽样解决方案,实现了可控、累积和可组合的图像编辑。此外,使用文本提示的简洁而强大的方法实现细粒度和细致的图像编辑。这个框架既简单高效,同时又能保留图像原始内容的本质。
Dec, 2023
Bellman Optimal Step-size Straightening (BOSS) technique improves flow-matching generative models by optimizing step sizes, achieving efficient image sampling while adhering to a computational budget constraint, thereby bridging the gap between low-resource constraints and demanding requirements of flow-matching generative models.
Dec, 2023
我们研究了基于ODE的生成模型(特别是流匹配),通过使用预训练的自编码网络将高维原始输入映射到低维潜在空间,再通过训练一个转换网络来预测从标准正态分布到目标潜在分布的变换速度场。我们的误差分析证明了这种方法的有效性,显示出通过估计ODE流生成的样本分布在温斯坦-2距离下收敛到目标分布,在温和和实际的假设下。此外,我们还展示了具有李普希茨连续性的转换网络可以有效逼近任意平滑函数,这可能具有独立的兴趣。
Apr, 2024
基于动态测量输运的生成模型通过学习常微分方程或随机微分方程,将初始条件从已知基础分布推导到目标分布。我们介绍了流图匹配算法,通过学习潜在常微分方程的双时间流图,得到了一个高效的几步生成模型,其步数可以根据精度和计算成本进行灵活的调节。与扩散模型或随机插值方法相比,流图匹配方法能够以显著降低的采样成本生成高质量样本。
Jun, 2024
本研究针对现有流匹配方法在生成建模中的效率问题,提出了一种局部流匹配(LFM)的方法,通过学习一系列流匹配子模型,以适应数据到噪声的扩散过程。结果表明,与传统方法相比,LFM在训练效率和生成性能上有显著提升,特别是在无条件生成表格数据和图像数据集方面。
Oct, 2024
本研究针对流匹配模型的取样计算资源消耗问题,提出了一种名为流生成匹配(FGM)的新方法,旨在将多步生成加速为一步生成,同时保持原有性能。在CIFAR10无条件生成基准上,FGM模型达到新的Fréchet Inception Distance(FID)记录,展示了其在高效性和生成质量上的显著影响。
Oct, 2024