Mar, 2025
MRCEval:一个全面、具有挑战性和易于访问的机器阅读理解基准
MRCEval: A Comprehensive, Challenging and Accessible Machine Reading
Comprehension Benchmark
TL;DR本研究解决了现有机器阅读理解(MRC)数据集仅评估特定方面的阅读理解能力这一问题,提出了新的分类法以区分关键能力。基于该分类法,我们构建了MRCEval基准,全面评估了大型语言模型的阅读理解能力,发现即使在大型语言模型时代,MRC仍然面临重大挑战。