BriefGPT.xyz
大模型
Ask
alpha
关键词
diverse human preference data
搜索结果 - 1
大型语言模型对齐的多样化偏好
通过混合不同的人类偏好数据集以增加数据量来增强奖励建模的方法可能失败,因此该研究提出了一种名为 MORE 的新的训练策略,通过自适应调整偏好目标来捕捉不同偏好中的共享人类价值观,实验证明 MORE 相较于其他方法在奖励准确性和校准误差方面有
→
PDF
7 months ago
Prev
Next