Jun, 2024

HelpSteer2: 用于训练最佳奖励模型的开源数据集

TL;DR通过使用 HelpSteer2 进行训练,我们提出了 SteerLM 2.0 模型对齐方法,能够有效利用我们的奖励模型预测的多属性分数,从而在对齐大型语言模型方面取得了 92.0% 的最新成果。