BriefGPT.xyz
Ask
alpha
关键词
model-induced process supervision
搜索结果 - 1
通过验证器进行多步问题求解:基于模型引导的过程监督的实证分析
通过使用训练过的验证器评估推理器生成的中间步骤,过程监督在多步问题解决中展示出了显著的改进。为了避免在验证器训练数据上进行昂贵的人工注释,本文引入了一种新颖的自动化数据整理方法,即模型引导的过程监督(MiPS)。MiPS 通过对推理模型的解
→
PDF
5 months ago
Prev
Next