Feb, 2024

万灵草: LLMs 的 Pareto 对齐通过偏好适应

TL;DRPanacea 是一种创新的方法,将对齐视为多维偏好优化问题,使用奇异值分解(SVD)的低秩适应来引导模型行为,从而无需进一步调整,实现了有效和高效地对齐模型以适应多样化和复杂的人类偏好。