Jun, 2024

BAPO:基于基准点偏好优化的大型语言模型个性化对齐

TL;DR个性化偏好优化对大型语言模型(LLMs)的影响及其在全球知识保持和对齐方面的应用进行了研究,提出了一种名为基锚偏好优化(BAPO)的简单而有效的方法,通过利用参考模型的初始响应来减轻遗忘而实现个性化对齐,BAPO 在不影响全球知识和整体对齐的情况下有效地适应多样化用户偏好。