Sep, 2023

利用计划评估进行最远推理:检索增强的大型语言模型稳定推理路径

TL;DR本文提出了一种针对多跳问题回答的新方法,称为 FuRePA,其中包括改进框架(Furthest Reasoning)和附加模块(Plan Assessor)。通过屏蔽之前的推理路径和生成的查询,鼓励 LLM 在每次迭代中从头开始生成思路,从而打破先前误导思想和查询的束缚。通过对三个公认的多跳问题回答数据集的评估,我们的方法在大多数指标上优于现有技术(回答准确率提高了 10%-12%)。