Oct, 2022

Lila: 数学推理的统一基准

TL;DR通过构建LILA基准测试,我们提出了一种旨在评估和改进人工智能系统在数学推理领域中表现的方法,并发现多任务学习可以显著提高性能,在一般数学推理和理解方面还有提高的余地。