EMNLPOct, 2023

MAF: 提升大型语言模型的推理能力的多方面反馈

TL;DR语言模型在自然语言任务中表现出令人印象深刻的性能,然而,在自然语言推理方面,语言模型仍面临幻觉、生成不正确的中间推理步骤和数学错误等挑战。最近的研究集中于通过自我改进和反馈来增强语言模型。然而,现有的方法依赖于单一的通用反馈来源,无法解决语言模型生成推理链中出现的多种错误类型。在这项工作中,我们提出了一种多方面反馈的迭代改进框架,该框架整合了多个反馈模块,包括冻结的语言模型和外部工具,每个模块都专注于特定的错误类别。我们的实验结果证明了我们的方法在解决语言模型生成的推理链中的几个错误,并因此提高了语言模型在多个推理任务中的整体性能。在数学推理中,我们看到了相对改进高达 20%,在逻辑推断中高达 18%。