BriefGPT.xyz
Ask
alpha
关键词
mistake detection and rectification
搜索结果 - 1
揭示致命缺陷:评估 LLM 在数学推理中处理错误的能力
通过引入一个包含正确和错误推理步骤的新数据集 MWP-MISTAKE,本研究重点探讨了大型语言模型在检测和纠正推理错误方面的能力,并通过全面的基准测试揭示了目前最先进模型(如 GPT-4o,GPT-4,GPT-3.5Turbo 等)的优点和
→
PDF
20 days ago
Prev
Next