Dec, 2024
解构偏好表示与文本生成以实现高效的个体偏好对齐
Disentangling Preference Representation and Text Generation for
Efficient Individual Preference Alignment
TL;DR本研究解决了大语言模型(LLMs)与个体人类偏好对齐效率不足的问题。我们提出了一种灵活的个体偏好对齐范式,通过将偏好表示与文本生成分离,显著提高了对齐算法的效率。实验表明,我们的方法在文本生成任务中展示了优于基于PEFT的方法,并且在对每个新个体偏好所需的额外训练时间上降低了80%至90%。