Feb, 2024

可控偏好优化:朝着可控的多目标对齐

TL;DR通过引入可控偏好优化(CPO),我们可以实现模型响应满足不同目标需求的对齐模型,并在多目标对齐中获得 Pareto 改进。