SQLFixAgent: 多智能体协作的语义准确 SQL 生成

Jun, 2024

SQLFixAgent: 多智能体协作的语义准确 SQL 生成

SQLFixAgent: Towards Semantic-Accurate SQL Generation via Multi-Agent Collaboration

Jipeng Cen, Jiaxin Liu, Zhixu Li, Jingjing Wang

TL;DR通过引入 SQLFixAgent 创新的多智能体协作框架，我们解决了大型预训练语言模型在生成 SQL 时语法合理但语义不准确的问题，从而提高了用户理解和系统可用性。

Abstract

While fine-tuned large language models (LLMs) excel in generating grammatically valid SQL in Text-to-SQL parsing, they often struggle to ensure semantic accuracy in queries, leading to user confusion and diminished system usability. To tackle this challenge, we introduce →

fine-tuned large language models sqlfixagent sqlrefiner sqlreviewer querycrafter

发现论文，激发创造

MAC-SQL: 文本到 SQL 的多智能体协作

最近的文本到 SQL 方法的发展使用了大型语言模型 (LLMs)，取得了显著的性能表现。然而，这些方法在处理庞大的数据库、复杂的用户查询和错误的 SQL 结果时仍然面临困难。为了解决这些挑战，我们提出了基于 LLMs 的多智能体协作文本到 SQL 框架 MAC-SQL。该框架由三个智能体组成：Selector 负责压缩庞大的数据库并保留用户问题的相关表模式；Decomposer 将复杂的用户问题分解为更简单的子问题并逐步解决；Refiner 负责验证和完善有缺陷的 SQL 查询。我们在两个 Text-to-SQL 数据集 BIRD 和 Spider 上进行了大量实验，在 BIRD 测试集上实现了 59.59% 的最先进的执行准确率。此外，我们还开源了基于 Code Llama 7B 的指导微调模型 SQL-Llama，以及基于 BIRD 和 Spider 训练数据的代理指令数据集。SQL-Llama 模型在 BIRD 和 Spider 的开发集上展示了令人鼓舞的结果，然而与 GPT-4 模型相比，仍有显著的提升潜力。我们的代码和数据可在 https://github.com/wbbeyourself/MAC-SQL 公开访问。

Dec, 2023

QueryAgent: 一个基于环境反馈的可靠高效推理框架

使用大型语言模型（LLMs）进行语义解析已经取得了显著的成功。本论文提出了一种名为 QueryAgent 的框架，通过逐步解决问题和进行自我纠正来解决可靠性和效率不足的问题。通过利用丰富的环境反馈，ERASER 方法在中间步骤中仅在必要时进行选择性和差异化的自我纠正。实验结果表明，QueryAgent 相比 GrailQA 和 GraphQ 上的所有先前的少样本方法，在仅使用一个示例的情况下，F1 值提高了 7.0 和 15.0。此外，我们的方法在运行时间、查询开销和 API 调用成本等方面表现出了优越性。通过利用 ERASER，我们进一步提高了另一个基准（即 AgentBench）约 10 个点，揭示了我们方法的强大可迁移性。

Mar, 2024

基于模型的交互式语义解析：统一框架和文本到 SQL 的案例研究

本论文提出了一个新的交互式语义解析问题的统一形式，其中的目标是设计一个基于模型的智能代理。代理能够自主决定是否和何时需要人类干预，并生成自然语言的澄清问题，使用了世界模型并在两个 Text-to-SQL 数据集上得到了很好的效果。

Oct, 2019

使用细粒度查询理解提升文本转 SQL 语义解析

本文提出了一种基于标记级精细化查询理解的通用、模块化的神经语义分析框架，包括命名实体识别器（NER）、神经实体链接器（NEL）和神经语义解析器（NSP），该框架联合建模查询和数据库，并基于动态生成的语法合成基于树结构的 SQL 查询。实验证明，该模型在 SQUALL 数据集上的执行准确率达到了 56.8％，超过了现有技术水平 2.7％。

Sep, 2022

带执行引导的 Text-to-SQL 生成的鲁棒性

该研究探讨了神经话语解析的问题，引入新的执行指南机制来利用 SQL 的语义，证明其普遍提高了基于自回归生成模型的语义解析模型的性能。

Jul, 2018

通过动态架构编码用自然语言纠正语义解析

提出了一种利用自然语言反馈进行语义解析更正的方法，通过将任务的语义和语法困难分离，只需一轮自然语言反馈即可将文本到 SQL 解析器的准确性提高 26％；同时表明 T5-base 模型能在无需训练的情况下，纠正 T5-large 模型的错误。

May, 2023

自然语言到 SQL 查询的类型和内容驱动合成

本文提出了一种新技术，可以从自然语言中自动合成 SQL 查询，并采用自然语言处理，程序合成和自动程序修复相结合的方法来增强其鲁棒性。

Feb, 2017

RepairAgent：基于 LLM 的自主程序修复代理

该论文介绍了 RepairAgent，其是第一个基于大型语言模型（LLM）的自主代理解决程序修复挑战的工作。RepairAgent 通过调用合适的工具来自主规划和执行修复操作，包括收集有关错误的信息、收集修复材料以及验证修复结果，并在先前修复尝试的反馈和信息基础上决定调用哪些工具。该研究表明，RepairAgent 在修复 164 个错误中表现出了良好的效果，并修复了先前技术无法修复的 39 个错误。与 LLM 的交互对每个错误平均造成了 270,000 个 token 的开销，根据 OpenAI GPT-3.5 模型的当前定价，平均每个错误的成本为 14 美分。这项工作是首次提出基于 LLM 的自主代理程序修复技术，为未来软件工程的代理技术铺平了道路。

Mar, 2024

与解析器对话：自然语言交互式文本到 SQL 转化与反馈

本文研究了使用自然语言反馈进行语义解析校正的任务，并构建了 SPLASH 数据集，证明这种反馈形式可以显著提高语义解析的准确性。

May, 2020

使用代码语言模型进行文本到 SQL 错误修正

本研究提出了一种基于从语言模型的预训练语料库中获得知识来更好地表示 SQL 查询及其编辑的方法，并探讨如何构建自动文本到 SQL 纠错模型，使用从语句层次的编辑模型取代仅仅是基于标记的编辑。该纠错模型能够使得不同解析器的准确匹配率提高 2.4-6.5%, 在两个强的基线上获得高达 4.3％的绝对改进。

May, 2023