ICLRJun, 2020

IsarStep: 高层次数学推理的基准测试

TL;DR本文提出了一种用于高级数学推理的数据集,研究了神经序列到序列模型的推理能力。实验结果表明,该任务具有挑战性,但神经模型能够捕捉到非平凡的数学推理,提出的分层 Transformer 的性能也好于基准 Transformer。