BriefGPT.xyz
Ask
alpha
关键词
math-shepherd
搜索结果 - 1
数学牧人:一种无需标签的逐步验证器,用于数学推理中的 LLMs
Math-Shepherd 是一种创新的过程导向数学验证器,使用自动生成的过程级监督数据进行训练,通过对 LLM 的输出逐步赋予奖励分数来解决复杂多步骤数学问题,指导一系列开源 LLMs 取得了非凡的性能,并在自洽性方法和其他验证模型方面表
→
PDF
7 months ago
Prev
Next