Feb, 2024

让推理有意义:衡量和提升思考推理的可靠性

TL;DR通过对十二个大型语言模型进行因果中介分析,本文发现大型语言模型在生成最终答案时并不可靠地使用中间推理步骤。为了解决这个问题,我们引入了 FRODO 框架,该框架通过使用隐式因果奖励函数生成正确的推理步骤,以及通过因果和对抗优化目标忠实地进行推理。实验证明,FRODO 显著优于其他四个基线方法,提高了推理语言模型的鲁棒性和泛化能力,在分布外测试集上表现更好。最后,我们发现 FRODO 的解释对最终答案的预测更加可靠。