- 逐步扩散:入门教程
我们提供了一门面向无扩散经验的技术人员的可达到的关于扩散模型和流匹配的机器学习入门课程,我们尽可能简化数学细节(有时启发式地),同时保留足够的精确性来推导正确的算法。
- 变分流匹配用于图生成
我们提出了一种称为变分流匹配 (VFM) 的流匹配式变分推理,即基于这个公式我们开发了 CatFlow,这是一种用于分类数据的流匹配方法,它易于实现、计算效率高,并在图生成任务中取得了较好的结果。
- 流匹配实现最小极大均衡收敛
该论文讨论了流匹配在 $p$-Wasserstein 距离方面的收敛性质,通过研究一类更广泛的向量场的均值和方差函数,确定实现这些最优速率所必需的特定条件,并且证明了流匹配能够达到与扩散模型相当的收敛速率,从而为流匹配作为一种无需模拟的生成 - 通过迭代损坏轨迹匹配实现线性反问题的流先验
利用基于流匹配的生成模型解决线性逆问题的迭代算法,通过近似最大后验估计,有效地优化多个局部目标,实现了超分辨率、去模糊、修补缺失和压缩感知等线性逆问题的优于流匹配的方法。
- 马尔可夫流匹配:用连续正规化流加速 MCMC
通过建模生成概率路径的向量场,连续归一化流(CNFs)利用神经网络学习参考密度与目标密度之间的概率路径。本文重新利用流匹配(FM)方法,结合马尔可夫采样方法评估 FM 目标和使用学习的概率路径改进蒙特卡洛采样,将该方法用于概率推断。我们提出 - ICML切换流匹配:通过切换 ODE 来消除奇异性
通过使用切换的普通微分方程 (ODEs) 来消除奇点问题,我们提出了一个更通用的框架,Switched FM (SFM),以解决连续时间生成模型中的采样速度缓慢的问题,并演示了该框架的有效性。
- 三维全新分子生成的混合连续和分类流匹配
在这项研究中,我们探索了用于生成化学分子的流匹配框架的扩展,该框架在 3D 分子生成方面取得了良好性能,并通过构建在概率简单形式上存在的流来对分类数据进行扩展,从而实现了改进的性能。
- 基于模拟自由流动的动态条件最优传输
我们研究了条件最优传输的几何性质并证明了一种推广了 Benamou-Brenier 定理的动力学表述。利用这些工具,我们提出了一种无需模拟的基于流的条件生成建模方法。我们的方法通过三角形条件最优传输方案将任意源分布与指定目标分布相耦合。我们 - 使用 Transformer 在潜空间中进行流匹配的收敛性分析
我们研究了基于 ODE 的生成模型(特别是流匹配),通过使用预训练的自编码网络将高维原始输入映射到低维潜在空间,再通过训练一个转换网络来预测从标准正态分布到目标潜在分布的变换速度场。我们的误差分析证明了这种方法的有效性,显示出通过估计 OD - LayoutFlow: 布局生成的流匹配
利用流匹配作为替代现有的基于扩散的布局生成模型的方法,我们提出了一种名为 LayoutFlow 的高效基于流的模型,用于生成高质量的布局。通过逐渐移动或流动初始样本的元素直到达到最终预测,我们的方法学习替代了逐步去噪噪声布局的元素。此外,我 - DepthFM: 快速单目深度估计与流匹配
使用流场匹配的方法,通过引入预训练的图像扩散模型作为先验,允许仅在合成数据上进行训练的深度估计模型在真实图像上得到泛化;引入辅助表面法线损失进一步改进深度估计,模型对深度估计的置信度进行可靠预测,且在复杂自然场景的标准基准上,轻量级的方法表 - 基于黎曼流匹配策略的机器人运动学习
我们引入了一种名为 Riemannian Flow Matching Policies(RFMP)的新型模型,用于学习和合成机器人视觉运动策略。RFMP 利用了流匹配方法的高效训练和推理能力,具备编码机器人任务中常见的高维多模态分布和简单快 - 扩展流匹配:一种具有广义连续方程的条件生成方法
本文基于流匹配理论开发了基于流匹配的条件生成理论,通过广义连续性方程数学框架,匹配矩阵场而非向量场,确保生成的条件分布的连续性,并通过实验和数学结果验证了我们的理论。
- 稳定自主流匹配
本文研究了具有稳定数据点的深度生成模型和控制理论之间的联系,并使用随机稳定性工具对流匹配模型进行了特征化。
- 贝尔曼最优步长的流匹配模型直线化
Bellman Optimal Step-size Straightening (BOSS) technique improves flow-matching generative models by optimizing step siz - AAAI基于 Transformer 的流匹配中的潜变空间编辑
通过流匹配和变压器(U-ViT)的结合,实现了简单高效的图像编辑方法,大大提高了生成模型的可扩展性和性能,并提供了对潜在结构和编辑能力的探索。通过引入一个名为 $u$-space 的编辑空间以及针对 ODE 求解器的适应性抽样解决方案,实现 - 增强潜在扩散与流匹配
通过将流匹配引入扩散模型和卷积解码器之间,结合扩散模型的多样性、流匹配的高效性和卷积解码器的有效性,我们实现了最先进的高分辨率图像合成。
- 探索利用扩散引导的流匹配的更直接轨迹
通过在整个分布层面上由扩散模型指导的耦合策略,基于直观轨迹生成(Flow Matching)的新方法 Straighter trajectories of Flow Matching (StraighFM) 实现了在在像素空间和潜在空间下的 - 引导式流生成建模与决策
使用非分类器引导的流匹配模型在条件图像生成和语音合成方面显著改善了样本质量,而且在计算量极低的情况下不会影响智能体的总体性能。
- 潜空间中的流匹配
本文提出了一种在预训练自编码器的潜在空间中应用流匹配的方法,以实现高分辨率图像合成的计算效率和可扩展性的提高,并将各种条件集成到流匹配中进行条件式生成任务,包括标签条件下的图像生成、图像修复和语义到图像的生成。通过大量实验,本方法在各种数据