BriefGPT.xyz
Ask
alpha
关键词
mathematical domains
搜索结果 - 1
AlphaMath 几乎接近零:无过程的过程监督
利用 Monte Carlo Tree Search (MCTS) 框架和大型语言模型 (LLMs) 自动生成解决步骤和评估信号,训练一个逐步价值模型以提高 LLM 在数学领域中的推理过程。实验证明,采用 LLMs 结合 MCTS 自动生成
→
PDF
2 months ago
Prev
Next