BriefGPT.xyz
Jul, 2024
改善语言模型的上下文感知偏好建模
Improving Context-Aware Preference Modeling for Language Models
HTML
PDF
Silviu Pitis, Ziang Xiao, Nicolas Le Roux, Alessandro Sordoni
TL;DR
本研究针对自然语言中的偏好反馈不明确和多维标准问题,提出了一种两步偏好建模方法。此方法首先选择上下文以解决不足指定性,然后基于所选上下文评估偏好。研究表明,添加上下文可以显著提高偏好模型的表现,并且开发的上下文条件偏好数据集展示了语言模型对于上下文特定偏好的评估能力,超越了现有的领先模型。
Abstract
While finetuning
Language Models
from pairwise preferences has proven remarkably effective, the underspecified nature of natural language presents critical challenges. Direct
Preference Feedback
is uninterpretabl
→