BriefGPT.xyz
Ask
alpha
关键词
compositional preference models
搜索结果 - 1
用于对齐语言模型的组合偏好模型
我们提出了一种新的偏好模型框架,即组合偏好模型(CPMs),它可以将一个全局偏好评估分解为多个可解释的特征,从提示的语言模型中获得这些特征的标量分数,并使用逻辑回归分类器聚合这些分数,实验证明,CPMs 不仅提高了泛化性能,并且对过度最优化
→
PDF
9 months ago
Prev
Next