关键词multi-step logical reasoning
搜索结果 - 2
- 多阶段逻辑推理能力评估的目标:Multi-LogiEval
为了评估大型语言模型在人类式的多步逻辑推理方面的能力,我们提出了一种综合评估数据集 Multi-LogiEval,该数据集囊括了多步逻辑推理、各种推理规则和深度,并覆盖了命题逻辑、一阶逻辑和非单调逻辑等三种逻辑类型。实验结果表明,随着推理步 - 明确规划有助于语言模型在逻辑推理中的表现
在本文中,我们提出了一个使用语言模型进行多步逻辑推理的新型系统,该系统将显式计划纳入其推理过程中,从而通过向前看到它们的未来效果,能够在每一步上做出更明智的推理决策。在我们的实验中,我们的完整系统明显优于其他竞争系统,在多项选择题回答任务中