自然语言到 SQL 查询的类型和内容驱动合成

Feb, 2017

自然语言到 SQL 查询的类型和内容驱动合成

Type- and Content-Driven Synthesis of SQL Queries from Natural Language

Navid Yaghmazadeh, Yuepeng Wang, Isil Dillig, Thomas Dillig

TL;DR本文提出了一种新技术，可以从自然语言中自动合成 SQL 查询，并采用自然语言处理，程序合成和自动程序修复相结合的方法来增强其鲁棒性。

Abstract

This paper presents a new technique for automatically synthesizing SQL queries from natural language. Our technique is fully automated, works for any database without requiring additional customization, and does not require users to know the underlying database schema. Our method achieves these goals by combining →

sql queries natural language processing program synthesis automated program repair semantic parsing

发现论文，激发创造

TypeSQL: 基于知识的类型感知神经网络文本到 SQL 生成

本文提出了一种新方法 TypeSQL，通过将问题转换为插槽填充任务，并利用类型信息来更好地理解自然语言问题中的稀有实体和数字，从而实现了通过自然语言与关系型数据库进行交互。在 WikiSQL 数据集上测试该方法，比现有技术提高了 5.5％的性能。同时，利用数据库内容进行访问可以显著提高用户查询的性能，TypeSQL 的准确度为 82.6％，相对于之前的内容敏感模型提高了 17.5％。

Apr, 2018

面向自然语言问题的语音驱动 SQL 查询生成：Speech-to-SQL

本文旨在设计更有效的语音接口，以便查询关系型数据库中的结构化数据。首先引入了一种名为 Speech-to-SQL 的任务，该任务旨在理解由人类发音传达的信息，并将其直接转化为结构化查询语言（SQL）语句。本文提出了一种称为 SpeechSQLNet 的新型端到端神经体系结构，该体系结构可以直接将人类的语音转化为 SQL 查询，而无需外部自动语音识别步骤。为验证所提出模型的有效性，另构建了一个名为 SpeechQL 的数据集，并展开了广泛的实验证明，证明 SpeechSQLNet 可以直接从人类语音中综合高质量的 SQL 查询，精确匹配准确性方面超越了各种竞争对手以及级联方法。

Jan, 2022

语义解析：基于语法和表格的 SQL 生成

利用生成模型将自然语言问题转换成 SQL 查询，并通过考虑表格结构和 SQL 语法来提高查询的可执行性和准确性。在 WikiSQL 数据集上进行实验，将执行准确率从 69.0％提高到 74.4％。

Apr, 2018

文本到 SQL 解析中合成高质量数据的重要性

本文提出了一种新颖的数据合成框架，其中包括来自模式的关键关系、强类型和基于模式距离的列抽样，并采用了 SQL-to-text 任务的中间表示（IR），进一步提高了生成的自然语言问题的质量。实验证明，当现有强大的语义解析器在高质量的合成数据上进行预调整时，这些模型在流行的基准测试中的准确性得到了显着提高。

Dec, 2022

通过可编辑的逐步说明进行交互式文本到 SQL 生成

本文介绍了一种新的交互机制，允许用户直接编辑一步一步的 SQL 解释，以纠正 SQL 错误，实验结果显示，我们的方法在执行准确性方面比三种 SOTA 方法至少高出 31.6％，用户研究进一步显示，我们的方法可以帮助用户在更短的时间内解决更多的 SQL 任务并提高信心水平，特别是为非专业人士扩展了数据库的使用。

May, 2023

SQL 查询生成的最新进展：综述

该论文综述了最新的自然语言转 SQL 查询方法和模型，并描述了使用深度学习技术的各种架构，阐述了数据集和评估指标。

May, 2020

SQLNet：无强化学习的自然语言结构化查询生成

本文提出了一种新的方法，即 SQLNet，通过避免不必要的序列结构来基本解决序列化时的顺序问题，并结合依赖图、序列－集合模型和列注意力机制，可以在 WikiSQL 任务中比之前的方法提高 9% 到 13% 的效果。

Nov, 2017

AskYourDB: 使用自然语言查询和可视化关系型数据库的端到端系统

使用自然语言处理和语义解析的方法，在数据库查询过程中引入智能化，以帮助商业用户能够直接查询数据库。同时增加了自动可视化框架使得产品可供商业使用。

Oct, 2022

SQL 生成中的双向注意力

该论文探究了自然语言生成 SQL 查询的问题，并使用综合方法设计了三个深度神经网络，应用双向注意机制和卷积神经网络的字符级嵌入来提高结果，最终在 WikiSQL 数据集上达到了最先进的结果。

Dec, 2017

CHESS: 上下文利用有效 SQL 综合

利用大型语言模型（LLMs）将自然语言问题转化为 SQL 查询（文本到 SQL）是一种有前途但具有挑战性的方法，特别是在应用于具有复杂和庞大模式的现实世界数据库时。我们提出了一个新的流程来解决这个问题，该流程有效地检索相关数据和上下文，选择一个高效的模式，并合成正确高效的 SQL 查询。

May, 2024