流线型迅速: 学会使用修正流生成和转移数据
研究了一种基于流的方法来解决优化运输问题,该方法可通过神经普通可微方程迭代地减少运输成本,同时自动维护边际约束,相对于已有的方法,该方法针对特定运输成本函数且内部减少可行耦合来减少运输成本,是一种单目标变体。
Sep, 2022
对于高维感知数据, 扩散模型生成通过将数据从噪声逆向转换而得, 并已成为一种强大的生成建模技术。最近, 矫正流是一种将数据和噪声连接在一条直线上的生成模型表达形式。本研究通过偏向感知相关尺度来改进现有的噪声采样技术, 以训练矫正流模型。通过大规模研究, 我们证明了这种方法相对于已有的扩散公式在高分辨率文本到图像合成方面的优越性能。此外, 我们提出了一种基于Transformer的文本到图像生成架构, 该架构利用了两种模态的不同权重, 并实现了图像和文本记号之间的双向信息流, 从而改善了文本理解、排版和人体偏好评级。我们证明了这种架构遵循可预测的扩展趋势, 并通过各种度量标准和人体评估来证实验证损失越低, 文本到图像合成越好。我们的最大模型超过了现有的最先进模型, 我们将公开我们的实验数据、代码和模型权重。
Mar, 2024
大规模扩散模型在生成任务中取得了显著的性能。矫正流是一种新的生成模型类别,在各个领域展现出了优越的性能。通过理论和实验证据,我们展示了基于矫正流的方法与扩散模型具有相似的功能,可以作为有效的先验。此外,基于矫正流的先验方法在图像反转方面表现出优越的性能。
Jun, 2024
基于动态测量输运的生成模型通过学习常微分方程或随机微分方程,将初始条件从已知基础分布推导到目标分布。我们介绍了流图匹配算法,通过学习潜在常微分方程的双时间流图,得到了一个高效的几步生成模型,其步数可以根据精度和计算成本进行灵活的调节。与扩散模型或随机插值方法相比,流图匹配方法能够以显著降低的采样成本生成高质量样本。
Jun, 2024
本研究解决了确定性流模型在模型估计和离散化误差敏感性上的问题,并且改善了受限于中间状态的样本选择限制。我们提出了一种将确定性流模型的基础常微分方程转化为随机微分方程的方法,创造了多个随机采样器,针对现有的确定性采样器在生成多样性和效率上的缺陷,显著提高了性能。
Oct, 2024
本研究解决了扩散和流匹配模型在推断过程中需要多个采样步骤的问题,限制了其在时间关键任务中的应用。通过对ReFlow程序的设计空间进行深入探讨,提出了七项针对训练动态、学习和推断的改进措施,这些改进经过在多个数据集上的全面消融研究验证,最终实现了快速生成的最先进FID评分。
Oct, 2024
本研究解决了扩散模型在视觉生成中生成速度慢的问题,提出了一种新颖的方法,即不将直线性作为主要训练目标,而是关注于达到一阶近似的ODE路径。我们的实验表明,新的改进扩散方法在降低训练成本的同时,简化了训练过程,并在性能上优于传统的改进流方法。
Oct, 2024
本研究解决了扩散模型在生成速度上的不足,提出了整流扩散的新方法,认为直线不是整流的重要训练目标,而是应关注近似一阶的ODE路径。研究结果显示,该方法不仅简化了训练过程,还能在更低的训练成本下实现优越的性能。
Oct, 2024
本研究解决了生成模型在图像反演和编辑中的局限性,特别是在信号的非线性漂移和扩散带来的挑战。通过提出使用动态最优控制的修正流反演方法,并证明该方法等价于修正随机微分方程,我们在零-shot反演和编辑中实现了先进的性能,显示出相较于以往工作更高的用户偏好。
Oct, 2024