Apr, 2024

MACM: 利用多主体系统解决复杂数学问题中的条件挖掘

TL;DR近期,GPT-4等大型语言模型在处理标准查询方面表现出卓越的能力,但在需要复杂的、多步骤逻辑推理的高级数学问题上,它们的性能大幅下降。为了增强其推理能力,目前的研究已经深入研究了提示工程,例如思考树和思考图等方法。然而,这些现有方法存在两个主要限制:一是在处理复杂数学问题方面的效果受到一定的限制,二是为单个问题设计不同的提示的必要性影响其通用性。为了克服这些限制,本文引入了条件挖掘的多智能体系统(MACM)提示方法,它不仅解决了复杂的数学问题,而且在各种数学上下文中展现了强大的泛化能力。在MACM的协助下,GPT-4 Turbo在MATH数据集中最具挑战性的五级数学问题的准确率从54.68%提高到76.73%。代码可在https://github.com/bin123apple/MACM获取。