BriefGPT.xyz
Ask
alpha
关键词
mathchat
搜索结果 - 2
MathChat:多轮交互中数学推理和指令遵循的基准评估
这篇论文介绍了一个专门设计用来评估大型语言模型在更广泛的数学任务上的 MathChat 基准测试,并观察到这些模型在单回合问题回答方面表现出色,但在需要持续推理和对话理解的复杂场景下性能显著下降。通过开发 MathChat sync 这样一
→
PDF
a month ago
挑战性数学问题求解的 GPT-4 实证研究
本文探索使用 GPT-4 解决更复杂的数学问题,并评估了各种使用 GPT-4 的方法,包括作者提出的新的对话式解决框架 - MathChat。针对 MATH 数据集中的困难高中竞赛题进行了评估,结果表明所提出的对话式方法具有优势。
PDF
a year ago
Prev
Next