流线型迅速:学会使用修正流生成和转移数据
研究了一种基于流的方法来解决优化运输问题,该方法可通过神经普通可微方程迭代地减少运输成本,同时自动维护边际约束,相对于已有的方法,该方法针对特定运输成本函数且内部减少可行耦合来减少运输成本,是一种单目标变体。
Sep, 2022
大规模扩散模型在生成任务中取得了显著的性能。矫正流是一种新的生成模型类别,在各个领域展现出了优越的性能。通过理论和实验证据,我们展示了基于矫正流的方法与扩散模型具有相似的功能,可以作为有效的先验。此外,基于矫正流的先验方法在图像反转方面表现出优越的性能。
Jun, 2024
对于高维感知数据,扩散模型生成通过将数据从噪声逆向转换而得,并已成为一种强大的生成建模技术。最近,矫正流是一种将数据和噪声连接在一条直线上的生成模型表达形式。本研究通过偏向感知相关尺度来改进现有的噪声采样技术,以训练矫正流模型。通过大规模研究,我们证明了这种方法相对于已有的扩散公式在高分辨率文本到图像合成方面的优越性能。此外,我们提出了一种基于 Transformer 的文本到图像生成架构,该架构利用了两种模态的不同权重,并实现了图像和文本记号之间的双向信息流,从而改善了文本理解、排版和人体偏好评级。我们证明了这种架构遵循可预测的扩展趋势,并通过各种度量标准和人体评估来证实验证损失越低,文本到图像合成越好。我们的最大模型超过了现有的最先进模型,我们将公开我们的实验数据、代码和模型权重。
Mar, 2024
基于扩散的统一框架(SemFlow)将语义分割和语义图像合成作为一对相反问题,通过训练一个常微分方程(ODE)模型在真实图像和语义掩码的分布之间进行传输,解决了扩散输出的随机性与分割结果唯一性之间的矛盾,同时提升生成结果的多样性,该框架在语义分割和语义图像合成任务上取得了有竞争力的结果,希望能激发人们重新思考低级和高级视觉的统一。
May, 2024
Language Rectified Flow 是一种基于标准概率流模型改进的方法,通过学习(神经)常微分方程模型在源分布和目标分布之间进行转换,提供了生成建模和领域转换的统一有效解决方案。实验证明该方法在多个 NLP 任务中能够持续优于其基准方法,显示出普适性、有效性和益处。
Mar, 2024
通过使用切换的普通微分方程 (ODEs) 来消除奇点问题,我们提出了一个更通用的框架,Switched FM (SFM),以解决连续时间生成模型中的采样速度缓慢的问题,并演示了该框架的有效性。
May, 2024
本文提出通过直接建模解曲线流和神经网络,消除昂贵的数值解算器,提高神经 ODE 的建模能力,并提供几种适用于不同应用场景的流体结构,从而提高计算效率和一致性。应用于时间序列建模、预测和密度估计,取得了良好的泛化性能。
Oct, 2021
我们介绍了一种基于常微分方程(ODE)的深度生成方法,称为条件 Follmer 流。该方法能够将标准高斯分布有效地转换为目标条件分布。在实现上,我们使用欧拉方法离散化流,并使用深度神经网络非参数地估计速度场。此外,我们推导出学习样本分布与目标分布之间的 Wasserstein 距离的非渐近收敛速率,为通过 ODE 流进行条件分布学习提供了首个全面的端到端误差分析。我们的数值实验展示了其在一系列场景中的有效性,从标准的非参数条件密度估计问题到涉及图像数据的更复杂挑战,证明了它在各种现有条件密度估计方法上的优势。
Feb, 2024