一次性读入（YORO）：学习将数据库知识内化用于文本到SQL

Sep, 2024

一次性读入（YORO）：学习将数据库知识内化用于文本到SQL

You Only Read Once (YORO): Learning to Internalize Database Knowledge for Text-to-SQL

Hideo Kobayashi, Wuwei Lan, Peng Shi, Shuaichen Chang, Jiang Guo...

TL;DR本研究解决了现有文本到SQL任务中重复编码数据库模式所导致的高推理成本和重要数据库知识被忽视的问题。YORO提出了一种新范式，通过在训练过程中将数据库知识直接内化到文本到SQL模型的参数知识中，消除了推理过程中的模式编码需求，显著降低输入标记长度，并在大型数据库上表现出色。

Abstract

While significant progress has been made on the Text-to-SQL task, recent solutions repeatedly encode the same database schema for every question, resulting in unnecessary high Inference Cost and often overlooking

发现论文，激发创造

使用关系感知自注意力编码数据库模式，用于文本到SQL解析器

通过使用自我关联，让编码器理解表格和列之间的关系，以及将该信息使用在问题的解释过程中，使得神经编码器-解码器系统能够在SQL查询的实现上具有较好的泛化性，从而在Spider数据集上获得42.94%的精确匹配准确率。

Jun, 2019

DuoRAT: 迈向更简单的文本到SQL模型

本研究旨在建立DuoRAT作为对最新的RAT-SQL模型的重新实现，验证其在使用关系感知或普通变换器作为构建块的情况下的有效性，并通过消融实验来确认一些技术的有用性以及结构化SQL功能和在问题与架构之间建立联系的冗余特征。

Oct, 2020

使用模式依赖性学习改进文本到SQL的转换

本篇论文提出了一种基于Schema Dependency的多任务Text-to-SQL模型（SDSQL），用于有效捕获问题和架构之间的交互，从而减少数据库执行所拖延的推理时间，具有更好的可扩展性和更高的性能。

Mar, 2021

探索跨领域文本到SQL泛化的未被充分利用的限制

在研究神经网络将文本描述翻译成SQL查询方面，在零射跨域设置下取得了显著进展，但是现有的文本到SQL模型在面对训练数据中很少出现的领域知识时不具有普适性。本文介绍了一种人工筛选的数据集 Spider-DK，用于研究文本到SQL模型在需要应用很少出现的领域知识时的预测表现。在 Spider-DK 中，我们通过添加反映现实世界问题的领域知识来修改一些 Spider 的样本，并证明当样本需要这种领域知识时，预测准确率显著下降，即使该领域知识出现在训练集中，模型对相关训练样本的预测仍然正确。

Sep, 2021

DIN-SQL：基于上下文分解的自我修正文本到SQL学习

研究了如何将复杂的文本到SQL任务分解为较小的子任务，从而显著提高大型语言模型（LLMs）在推理过程中的性能，证明了将SQL查询分解为子问题并将这些子问题的解决方案提供给LLMs可以显著提高性能。在三个LLMs上的实验表明，此方法始终将性能提高约10％，推动LLMs的准确性接近最先进水平，甚至超过用于持有Spider数据集的大型精调模型。

Apr, 2023

UNITE: 一个用于文本到SQL评估的统一基准

本论文介绍了一个名为 UNITE 的统一文本到SQL评估基准，其中包含来自 12 个以上领域的自然语言问题，来自 3.9K 多个 SQL 模式的查询以及 29K 个数据库，并比较了六种最新的 SOTA 文本到SQL解析器在这个基准上的表现，揭示了这些最先进的模型在组合泛化和鲁棒性问题上仍然存在困难。

May, 2023

通过数据库模式修剪改进自我关注的多语言 SQL 翻译器

本文提出了一种技术，使长文本序列可以通过transformers处理，这对于自然语言到SQL查询的翻译非常有用，该技术包括训练过程、数据库架构修剪和多语言方法。

Jun, 2023

一种先进的文本到结构化查询语言模型的领域适应：经验教训与挑战

在Text-to-SQL任务中，通过领域适应性实现将Text-to-SQL系统应用于真实用例仍然是一个艰巨的挑战。通过对基础模型在Spider数据集之外的查询结构进行fine-tuning，并采用基于规则的方法解决输入问题中的值的歧义性，我们展示了T5和Picard在何种情况下能够提供良好性能，分享了所学到的经验，并讨论了当前领域适应性的挑战。

Dec, 2023

Open-SQL 框架：在开源大型语言模型上增强文本到SQL转换

我们提出了一种针对开源大型语言模型在Text-to-SQL任务中的上下文理解和响应连贯性问题的系统方法，包括对开源大型语言模型在Text-to-SQL任务中的全面评估，以及用于有效问题表示的openprompt策略、监督微调的新策略、步骤推理中Chain-of-Thought的优势探索和用于增强少样本学习的openexample方法。此外，我们引入了一些高效的技术，如可变长度的开发数据库架构、目标列截断和示例列截断，解决了大规模数据库中的挑战。我们的研究结果强调了对监督微调对上下文学习能力的影响进行进一步研究的必要性。值得注意的是，我们的方法显著提高了Llama2-7B在BIRD-Dev数据集上的性能，从2.54%提高到41.04%，Code Llama-7B在BIRD-Dev数据集上的性能甚至超过了GPT-4（46.35%）。

May, 2024

下一代数据库接口：LLM基于文本到SQL的调查

根据自然语言问题（文本到SQL）生成准确的SQL是一个长期存在的问题，传统的文本到SQL系统使用人工工程和深度神经网络，而最近的大型语言模型（LLMs）已经展示出在自然语言理解方面的显著能力，因此，将LLM-based实现整合到文本到SQL研究中可以带来独特的机遇、挑战和解决方案。

Jun, 2024