ICLRJun, 2020
IsarStep: 高层次数学推理的基准测试
IsarStep: a Benchmark for High-level Mathematical Reasoning
Wenda Li, Lei Yu, Yuhuai Wu, Lawrence C. Paulson
TL;DR本文提出了一种用于高级数学推理的数据集,研究了神经序列到序列模型的推理能力。实验结果表明,该任务具有挑战性,但神经模型能够捕捉到非平凡的数学推理,提出的分层 Transformer 的性能也好于基准 Transformer。