MIGA：面向会话式文本到 SQL 统一的多任务生成框架

AAAIDec, 2022

MIGA：面向会话式文本到 SQL 统一的多任务生成框架

MIGA: A Unified Multi-task Generation Framework for Conversational Text-to-SQL

Yingwen Fu, Wenjie Ou, Zhou Yu, Yue Lin

TL;DR本文介绍了一种新的基于预训练语言模型的多任务生成方法，该方法能有效解决多对话查询 (logical forms) 生成中的误差传播问题，并在 SparC 和 CoSQL 等基准测试中具有最先进的性能表现。

Abstract

conversational text-to-sql is designed to translate multi-turn natural language questions into their corresponding SQL queries. Most state-of-the-art conversational text- to-SQL methods are incompatible with generative

conversational text-to-sql natural language processing pre-trained language models seq2seq paradigm error propagation

发现论文，激发创造

面向会话的文本到 SQL 转换：现状和未来挑战的探索

通过多任务联合训练和模式重排应用于 text-to-SQL 任务中，可以显著提高模型的表现，进一步结合查询计划模型和模式链接算法后，T5-3B 的精确匹配和执行匹配的准确度均超过 SOTA 基线。

Feb, 2023

SeqGenSQL -- 用于结构化查询语言的稳健序列生成模型

利用 T5 模型进行文本转 SQL，结合问题增值和自动生成的银标识训练数据，实现了较高的 SQL 执行精度，并接近基于逻辑形式的最新的具有 SOTA 性能系统。

Nov, 2020

MAC-SQL: 文本到 SQL 的多智能体协作

最近的文本到 SQL 方法的发展使用了大型语言模型 (LLMs)，取得了显著的性能表现。然而，这些方法在处理庞大的数据库、复杂的用户查询和错误的 SQL 结果时仍然面临困难。为了解决这些挑战，我们提出了基于 LLMs 的多智能体协作文本到 SQL 框架 MAC-SQL。该框架由三个智能体组成：Selector 负责压缩庞大的数据库并保留用户问题的相关表模式；Decomposer 将复杂的用户问题分解为更简单的子问题并逐步解决；Refiner 负责验证和完善有缺陷的 SQL 查询。我们在两个 Text-to-SQL 数据集 BIRD 和 Spider 上进行了大量实验，在 BIRD 测试集上实现了 59.59% 的最先进的执行准确率。此外，我们还开源了基于 Code Llama 7B 的指导微调模型 SQL-Llama，以及基于 BIRD 和 Spider 训练数据的代理指令数据集。SQL-Llama 模型在 BIRD 和 Spider 的开发集上展示了令人鼓舞的结果，然而与 GPT-4 模型相比，仍有显著的提升潜力。我们的代码和数据可在 https://github.com/wbbeyourself/MAC-SQL 公开访问。

Dec, 2023

多关注历史记录：一种面向会话文本到 SQL 的上下文建模策略

本研究提出了两个对话建模任务，旨在辅助多轮对话语义解析。结果表明，在上下文总结和明确建模每个轮次的语义变化方面，可以极大提高多轮语义解析的性能。

Dec, 2021

MIGC: 文本到图像合成的多实例生成控制器

我们提出了一个多实例生成任务（MIG），在一幅图像中同时生成具有多样控制的多个实例。通过将 MIG 任务分解为若干子任务，并引入创新方法 MIGC，利用实例增强的注意力机制精确阴影每个实例并聚合它们来生成多个整合属性和位置的实例。在 COCO-MIG 基准上进行了广泛实验，评估结果显示了我们模型在数量、位置、属性和交互方面的优异控制能力。

Feb, 2024

下一代数据库接口：LLM 基于文本到 SQL 的调查

根据自然语言问题（文本到 SQL）生成准确的 SQL 是一个长期存在的问题，传统的文本到 SQL 系统使用人工工程和深度神经网络，而最近的大型语言模型（LLMs）已经展示出在自然语言理解方面的显著能力，因此，将 LLM-based 实现整合到文本到 SQL 研究中可以带来独特的机遇、挑战和解决方案。

Jun, 2024

面向复杂文本到 SQL 的模式感知多任务学习

传统的文本到 SQL 解析器在合成涉及多个表格或列的复杂 SQL 查询方面表现不佳，为了解决这个问题，我们提出了一种面向模式的多任务学习框架（名为 MTSQL）来处理复杂的 SQL 查询。通过设计一个模式链接鉴别器模块来区分有效的问题 - 模式关联，明确指示编码器通过特殊的链接关系来增强对齐质量。在解码器方面，我们定义了 6 种关系类型来描述表格和列之间的连接，并引入以运算符为中心的三元抽取器来识别那些与预定义关系相关的模式项。此外，我们通过预测的三元组建立了一组语法约束规则集，用于在 SQL 生成过程中过滤适当的 SQL 运算符和模式项。在跨领域的具有挑战性的文本到 SQL 基准测试 Spider 上，实验结果表明 MTSQL 比基线方法更有效，特别是在极端困难的场景中。此外，进一步的分析验证了我们的方法在处理复杂 SQL 查询方面的有希望的改进。

Mar, 2024

基于检索增强的 GPT-3.5 的文本到 SQL 框架，具备样本感知提示和动态修订链

本文提出一种基于大型语言模型的 Text-to-SQL 框架 —— 检索增强提示法，包括样本感知提示和动态修订链，通过引入检索来生成针对自然语言问题的 SQL 查询。

Jul, 2023

基于语法的神经网络文本到 SQL 生成

本文提出了一种处理 neural text-to-SQL models 中编写语法的复杂性的技术，从而生成 schema-dependent grammar，对 ATIS 和 Spider 两个挑战性的 text-to-SQL 数据集进行分析，显示可以减少 14-18% 的相对误差。

May, 2019

Wav2SQL: 通用直接的语音转 SQL 解析

本文提出了第一个直接语音转 SQL 的解析模型 Wav2SQL，利用最近的大规模预训练技术来缓解数据稀缺问题，通过语音重新编程和梯度反转分类器技术减少声学差异和学习的样式无关表示，显著提高准确性。

May, 2023