Jun, 2024

MDCR: 多文档条件推理数据集

TL;DR提出了一个新的数据集MDCR来评估模型在跨文档推理和优化问题上的答题能力,使用最新的LLMs评估了该数据集,并展示了它们在解决这个任务上的局限性。