May, 2024

大型语言模型的个性化引导:通过双向偏好优化实现多功能引导向量

TL;DR通过双向偏好优化来产生更有效的转向向量,从而在多种开放生成任务中实现个性化控制,并在关键对齐场景中展示出卓越的转向效果以及多个向量同时应用时的协同效益。