Oct, 2022

使用组合推理变换器从语言模型中解开推理能力

TL;DRReasonFormer 是一个统一的推理框架,受认知科学中的双过程理论的启发,它可以模拟人类在复杂决策制定中的模块化和组合推理过程。它由表示模块和推理模块组成,可以捕捉不同层次的认知过程,并模拟组合推理过程来控制推理技能的激活以及推理深度。ReasonFormer 通过单一模型解决多个任务,并在端到端的方式下进行训练和推断。在 11 个需要不同推理技能和复杂度的数据集上进行评估,ReasonFormer 展示了显著的性能提升,揭示了组合推理的能力。而且它在少样本的实验中表现出更好的泛化能力,并解耦表示模块和推理模块。最后通过进一步的分析也揭示了推理模块的模块化特性。