ACLMay, 2023

蒙特卡罗规划的忠实问答

TL;DR本论文提出 FAithful question answering with MontE-carlo planning (FAME)方法,以结构化蕴含树方式展示中间推理步骤,包含多个基础任务模块并通过蒙特卡罗规划算法作为控制器提出行动,旨在回答问题并与大型语言模型相比,使用更小的模型大小实现了最先进的性能。