Feb, 2024

面向语言模型对齐的高效准确优化

TL;DR我们提出了一种高效的精确优化方法 (EXO),证明了它在与 RL 算法同向渐进地优化策略参数函数上是可保证的,并通过绕过与 RL 算法相关的复杂性来实现高效优化。我们通过理论和实证分析将我们的方法与 DPO 进行比较,并进一步展示了在现实人类偏好数据上我们方法的优势。