May, 2023
SCITAB: 一个用于科学数据表格组合推理和论断验证的重要基准测试
SCITAB: A Challenging Benchmark for Compositional Reasoning and Claim Verification on Scientific Tables
Xinyuan Lu, Liangming Pan, Qian Liu, Preslav Nakov, Min-Yen Kan
TL;DR构建 SCITAB 数据集用于科学事实审查,从实际科学陈述中提取复合表理推理的 1225 个挑战性科学主张,将其证据呈现为表格形式,揭示了现有提示方法的限制和挑战,提出了未来研究方向。