通过最优传输实现 LLM 的分布偏好对齐

Jun, 2024

通过最优传输实现 LLM 的分布偏好对齐

Distributional Preference Alignment of LLMs via Optimal Transport

Igor Melnyk, Youssef Mroueh, Brian Belgodere, Mattia Rigotti, Apoorva Nitsure...

TL;DR基于最优输运的对齐（AOT）是一种针对 LLMs 的分布偏好对齐的新方法，通过在未配对的偏好数据中使正样本的奖励分布在一阶随机支配负样本的分布来对齐 LLMs。我们使用平滑和凸代价，对这种一阶随机支配的凸松弛进行了引入，并将其作为一个最优输运问题。通过实证测量排序，由于最优输运问题的一维特性和成本的凸性，它有一个封闭的解。我们通过罚除违反正样本奖励分布对负样本奖励分布的随机支配来使用 AOT 目标微调 LLMs，并通过考虑 OT 问题的对偶并证明其以参数速率收敛来分析 AOT 的样本复杂性。在各种对齐数据集和 LLMs 上的实证结果表明，在 Open LLM Benchmarks 和 AlpacaEval 的评估中，AOT 能够产生最先进的 7B 系列模型。

Abstract

Current llm alignment techniques use pairwise human preferences at a sample level, and as such, they do not imply an alignment on the distributional level. We propose in this paper alignment via optimal transport

llm alignment techniques alignment via optimal transport distributional preference alignment convex relaxation sample complexity

发现论文，激发创造

多模态分布对齐的分层最优输运

该研究提出了一个基于最优传输与聚类结构相结合的层级对齐方法，同时采用 ADMM 算法和 Sinkhorn 距离来提高噪声、模糊或多峰数据的对齐精度，并在合成数据和神经信号解码中进行了应用，表明该方法对于具有一致聚类结构的数据集在跨领域对齐方面具有显著的性能改进作用。

Jun, 2019

非平衡最优输运半对偶形式生成建模

本文提出基于 Unbalanced Optimal Transport (UOT) 的半对偶形式构建的新型生成模型，相比于基于 OT 的方法在处理噪点，稳定性和训练收敛速度等方面表现更优。通过实验验证了该模型的性质，并研究了 UOT 之间分布差异的理论上界。实验结果显示，该模型在 CIFAR-10 和 CelebA-HQ-256 数据集上的 FID 分别为 2.97 和 5.80，优于现有基于 OT 的生成模型。

May, 2023

分析和改进基于 OT 的对抗网络

以单一框架统一 Optimal Transport（OT）为基础的对抗方法，通过对统一框架的全面分析来阐明每个组成部分在训练动力学中的作用。我们提出了一个简单而新颖的方法，逐步改进生成分布，并逐渐与数据分布对齐。该方法在 CIFAR-10 上实现了 2.51 的 FID 得分，胜过了统一的基于 OT 的对抗方法。

Oct, 2023

非平衡词对齐的非平衡最优输运

本文研究了单语词汇对齐中的空对齐现象并提出了使用最优传输方法实现不均衡对齐且与专门设计的方法具有竞争力的方法。

Jun, 2023

大规模最优输运和映射估计

本文提出了一个新颖的两步方法来解决基本问题，即从一个分布学习到另一个分布的最优映射，首先我们学习一个最优传输（OT）方案，其次我们估计 Monge 映射作为一个深度神经网络，演示了我们的建议方法在域适应和生成建模方面的应用。

Nov, 2017

OTA: 目标检测的最优传输分配

本文提出了一种从全局角度重新考虑标签分配的方法，将其表述为最优输运（OT）问题，并使用 Sinkhorn-Knopp 迭代法求解，经实验证明这种方法在物体检测中具有显著的效果提升。

Mar, 2021

共同优化传输

提出一种名为 COOT 的新型最优输运问题，它同时优化两个输运映射，用于异质域适应和聚类数据总结，相比现有的方法，COOT 表现出更高的性能。

Feb, 2020

大规模最优输运的随机优化

提出一种新的随机优化算法来应对机器学习中遇到的大规模问题，该方法利用任意分布的样本来避免将密度值离散化，并提供了可证明收敛的方法，输出正确的距离。

May, 2016

通过近似最优传播改进生成模型

我们介绍了逼近最优输运（Approximated Optimal Transport，AOT）技术，一种用于扩散式生成模型的新型训练方案。我们的方法旨在逼近并将最优输运集成到训练过程中，大大提高了扩散模型准确估计去噪器输出的能力。通过在训练中使用 AOT，我们实现了优越的图像质量和减少的采样步骤。特别是在无条件和有条件生成中，我们分别仅使用 27 个 NFE（Numerical Fourier Expansion）和 29 个 NFE，实现了 1.88 和 1.73 的 FID（Fréchet Inception Distance）分数。此外，当将 AOT 应用于指导鉴别器的训练时，在无条件和有条件生成方面，我们分别取得了 1.68 和 1.58 的新领先 FID 分数，每个模型使用 29 个 NFE。这一结果证明了 AOT 在提升扩散模型性能方面的有效性。

Mar, 2024

离散概率逆最优输运

本文通过熵正则化的 Optimal transport（OT）工具，对 Inverse Optimal Transport（IOT）进行正式化和系统分析，包括代价等价成本的流形特性、模型先验的影响以及基于模拟的结果验证等方面。

Dec, 2021