Dec, 2023

MAC-SQL: 文本到 SQL 的多智能体协作

TL;DR最近的文本到 SQL 方法的发展使用了大型语言模型 (LLMs),取得了显著的性能表现。然而,这些方法在处理庞大的数据库、复杂的用户查询和错误的 SQL 结果时仍然面临困难。为了解决这些挑战,我们提出了基于 LLMs 的多智能体协作文本到 SQL 框架 MAC-SQL。该框架由三个智能体组成:Selector 负责压缩庞大的数据库并保留用户问题的相关表模式;Decomposer 将复杂的用户问题分解为更简单的子问题并逐步解决;Refiner 负责验证和完善有缺陷的 SQL 查询。我们在两个 Text-to-SQL 数据集 BIRD 和 Spider 上进行了大量实验,在 BIRD 测试集上实现了 59.59% 的最先进的执行准确率。此外,我们还开源了基于 Code Llama 7B 的指导微调模型 SQL-Llama,以及基于 BIRD 和 Spider 训练数据的代理指令数据集。SQL-Llama 模型在 BIRD 和 Spider 的开发集上展示了令人鼓舞的结果,然而与 GPT-4 模型相比,仍有显著的提升潜力。我们的代码和数据可在 https://github.com/wbbeyourself/MAC-SQL 公开访问。