ACLJun, 2024

StatBot.Swiss: 双语自然语言下的开放数据探索

TL;DR使用大型语言模型(LLMs)在 Text-to-SQL 系统方面的潜力主要集中在英文单语数据集上的评估,然而,LLMs 在其他语言上的表现鲜有研究。本研究发布了 StatBot.Swiss 数据集,这是第一个基于真实应用程序评估 Text-to-SQL 系统的双语基准数据集。StatBot.Swiss 数据集包含了 455 个英文和德文之间的自然语言 / SQL 对,涵盖了 35 个不同难度级别的大型数据库。我们使用 GPT-3.5-Turbo 和 mixtral-8x7b-instruct 等最先进的 LLMs 来评估 Text-to-SQL 翻译任务的性能,并采用上下文学习方法。我们的实验分析表明,目前的 LLMs 在生成 SQL 查询语句方面在我们的新型双语数据集上普遍存在泛化能力不佳的问题。