SQLFixAgent: 多智能体协作的语义准确 SQL 生成
最近的文本到 SQL 方法的发展使用了大型语言模型 (LLMs),取得了显著的性能表现。然而,这些方法在处理庞大的数据库、复杂的用户查询和错误的 SQL 结果时仍然面临困难。为了解决这些挑战,我们提出了基于 LLMs 的多智能体协作文本到 SQL 框架 MAC-SQL。该框架由三个智能体组成:Selector 负责压缩庞大的数据库并保留用户问题的相关表模式;Decomposer 将复杂的用户问题分解为更简单的子问题并逐步解决;Refiner 负责验证和完善有缺陷的 SQL 查询。我们在两个 Text-to-SQL 数据集 BIRD 和 Spider 上进行了大量实验,在 BIRD 测试集上实现了 59.59% 的最先进的执行准确率。此外,我们还开源了基于 Code Llama 7B 的指导微调模型 SQL-Llama,以及基于 BIRD 和 Spider 训练数据的代理指令数据集。SQL-Llama 模型在 BIRD 和 Spider 的开发集上展示了令人鼓舞的结果,然而与 GPT-4 模型相比,仍有显著的提升潜力。我们的代码和数据可在 https://github.com/wbbeyourself/MAC-SQL 公开访问。
Dec, 2023
使用大型语言模型(LLMs)进行语义解析已经取得了显著的成功。本论文提出了一种名为 QueryAgent 的框架,通过逐步解决问题和进行自我纠正来解决可靠性和效率不足的问题。通过利用丰富的环境反馈,ERASER 方法在中间步骤中仅在必要时进行选择性和差异化的自我纠正。实验结果表明,QueryAgent 相比 GrailQA 和 GraphQ 上的所有先前的少样本方法,在仅使用一个示例的情况下,F1 值提高了 7.0 和 15.0。此外,我们的方法在运行时间、查询开销和 API 调用成本等方面表现出了优越性。通过利用 ERASER,我们进一步提高了另一个基准(即 AgentBench)约 10 个点,揭示了我们方法的强大可迁移性。
Mar, 2024
本论文提出了一个新的交互式语义解析问题的统一形式,其中的目标是设计一个基于模型的智能代理。代理能够自主决定是否和何时需要人类干预,并生成自然语言的澄清问题,使用了世界模型并在两个 Text-to-SQL 数据集上得到了很好的效果。
Oct, 2019
本文提出了一种基于标记级精细化查询理解的通用、模块化的神经语义分析框架,包括命名实体识别器(NER)、神经实体链接器(NEL)和神经语义解析器(NSP),该框架联合建模查询和数据库,并基于动态生成的语法合成基于树结构的 SQL 查询。实验证明,该模型在 SQUALL 数据集上的执行准确率达到了 56.8%,超过了现有技术水平 2.7%。
Sep, 2022
该研究探讨了神经话语解析的问题,引入新的执行指南机制来利用 SQL 的语义,证明其普遍提高了基于自回归生成模型的语义解析模型的性能。
Jul, 2018
提出了一种利用自然语言反馈进行语义解析更正的方法,通过将任务的语义和语法困难分离,只需一轮自然语言反馈即可将文本到 SQL 解析器的准确性提高 26%;同时表明 T5-base 模型能在无需训练的情况下,纠正 T5-large 模型的错误。
May, 2023
该论文介绍了 RepairAgent,其是第一个基于大型语言模型(LLM)的自主代理解决程序修复挑战的工作。RepairAgent 通过调用合适的工具来自主规划和执行修复操作,包括收集有关错误的信息、收集修复材料以及验证修复结果,并在先前修复尝试的反馈和信息基础上决定调用哪些工具。该研究表明,RepairAgent 在修复 164 个错误中表现出了良好的效果,并修复了先前技术无法修复的 39 个错误。与 LLM 的交互对每个错误平均造成了 270,000 个 token 的开销,根据 OpenAI GPT-3.5 模型的当前定价,平均每个错误的成本为 14 美分。这项工作是首次提出基于 LLM 的自主代理程序修复技术,为未来软件工程的代理技术铺平了道路。
Mar, 2024
本文研究了使用自然语言反馈进行语义解析校正的任务,并构建了 SPLASH 数据集,证明这种反馈形式可以显著提高语义解析的准确性。
May, 2020
本研究提出了一种基于从语言模型的预训练语料库中获得知识来更好地表示 SQL 查询及其编辑的方法,并探讨如何构建自动文本到 SQL 纠错模型,使用从语句层次的编辑模型取代仅仅是基于标记的编辑。该纠错模型能够使得不同解析器的准确匹配率提高 2.4-6.5%, 在两个强的基线上获得高达 4.3%的绝对改进。
May, 2023