BriefGPT.xyz
大模型
Ask
alpha
关键词
pairwise preference datasets
搜索结果 - 1
Hummer: 朝着有限竞争偏好数据集的方向
引入了一种新的统计度量指标,即 Alignment Dimension Conflict,用于量化偏好数据集内部的冲突程度。提出了 Hummer 和 Hummer-F 这两个创新的成对偏好数据集,并开发了 HummerRM 和 Hummer
→
PDF
a month ago
Prev
Next