ICLRMay, 2022

从自采样的正确和部分正确的解中学习数学推理

TL;DR本文提出使用预先训练的语言模型和部分正确的解决方案来解决数学推理问题的训练方法,并探索了各种训练目标对性能的影响。部分正确的解决方案有助于模型对解决方案空间进行更有效的探索。在两个数学推理数据集上的实验显示出方法的有效性。