ACLFeb, 2024

Archer:一个包含算术、常识和假设推理的人工标注文本到 SQL 的数据集

TL;DRArcher 是一个具有挑战性的双语文本转 SQL 数据集,专注于复杂推理,包括算术、常识和假设推理。它包含 1042 个英文问题和 1042 个中文问题,以及 521 个不同的 SQL 查询,涵盖了 20 个英文数据库在 20 个领域中。该数据集相比现有公开数据集具有明显更高的复杂性。通过我们的评估,Archer 挑战了当前最先进模型的能力,目前在 Archer 测试集上排名最高的模型仅达到 6.73%的执行准确率。因此,Archer 对未来在该领域的研究提出了重要挑战。