BriefGPT.xyz
Ask
alpha
关键词
reasoning performances
搜索结果 - 1
推理轨迹上的偏好优化
这篇论文提出使用偏好优化方法来提高语言模型的推理性能,通过在思维链中应用这些方法,可以改进语言模型在推理任务中的表现。借助理由追踪数据集,我们提出了两种补充方案:数字损坏和弱语言模型提示。这种方法在 Falcon2-11B 和 Mistra
→
PDF
13 days ago
Prev
Next