使用强化学习从自然语言生成结构化查询的 Seq2SQL 模型

Aug, 2017

使用强化学习从自然语言生成结构化查询的 Seq2SQL 模型

Seq2SQL: Generating Structured Queries from Natural Language using Reinforcement Learning

Victor Zhong, Caiming Xiong, Richard Socher

TL;DR提出一种基于深度神经网络 Seq2SQL 的 SQL 查询翻译模型，利用强化学习策略优化模型，并结合 WikiSQL 数据集进行模型训练，性能比注意力机制模型更好，精度从 35.9% 提高至 59.4%。

Abstract

A significant amount of the world's knowledge is stored in relational databases. However, the ability for users to retrieve facts from a database is limited due to a lack of understanding of query languages such as SQL. We propose seq2sql, a deep →

seq2sql neural network sql queries reinforcement learning dataset

发现论文，激发创造

SQLNet：无强化学习的自然语言结构化查询生成

本文提出了一种新的方法，即 SQLNet，通过避免不必要的序列结构来基本解决序列化时的顺序问题，并结合依赖图、序列－集合模型和列注意力机制，可以在 WikiSQL 任务中比之前的方法提高 9% 到 13% 的效果。

Nov, 2017

SeqGenSQL -- 用于结构化查询语言的稳健序列生成模型

利用 T5 模型进行文本转 SQL，结合问题增值和自动生成的银标识训练数据，实现了较高的 SQL 执行精度，并接近基于逻辑形式的最新的具有 SOTA 性能系统。

Nov, 2020

一个编码器 - 解码器框架，将自然语言翻译为数据库查询

本研究考虑将自然语言转换成 SQL，用于关系数据库的数据检索。我们提出了一种新的编码 - 解码框架，包括新的语义特征和语法感知状态等新方法。实证评估结果表明，我们的方法在真实世界的数据库和查询上明显优于现有技术。

Nov, 2017

使用 Graph-to-Sequence 模型进行 SQL 到文本生成

本文提出了一种将 SQL 查询表示为有向图的策略，并采用图到序列模型将全局结构信息编码成节点嵌入的方法，从而有效地学习 SQL 查询模式和其解释之间的相关性，实验结果表明，我们的模型在 WikiSQL 数据集和 Stackoverflow 数据集上表现显著优于 Seq2Seq 和 Tree2Seq 基线模型，达到了最先进的性能水平。

Sep, 2018

SQL 生成中的双向注意力

该论文探究了自然语言生成 SQL 查询的问题，并使用综合方法设计了三个深度神经网络，应用双向注意机制和卷积神经网络的字符级嵌入来提高结果，最终在 WikiSQL 数据集上达到了最先进的结果。

Dec, 2017

语义解析：基于语法和表格的 SQL 生成

利用生成模型将自然语言问题转换成 SQL 查询，并通过考虑表格结构和 SQL 语法来提高查询的可执行性和准确性。在 WikiSQL 数据集上进行实验，将执行准确率从 69.0％提高到 74.4％。

Apr, 2018

基于深度学习的自然语言文本到 SQL 查询转换：一项调查

本文研究了使用自然语言作为桥梁，通过有效访问数据库创建一个高效的文本到 SQL 模型，重点探讨了 24 个不同神经网络模型以及 11 个常用数据集的特点和局限性，最终讨论了 Text2SQL 技术在实现无缝数据查询方面的可能性。

Aug, 2022

SQL 查询生成的最新进展：综述

该论文综述了最新的自然语言转 SQL 查询方法和模型，并描述了使用深度学习技术的各种架构，阐述了数据集和评估指标。

May, 2020

面向自然语言问题的语音驱动 SQL 查询生成：Speech-to-SQL

本文旨在设计更有效的语音接口，以便查询关系型数据库中的结构化数据。首先引入了一种名为 Speech-to-SQL 的任务，该任务旨在理解由人类发音传达的信息，并将其直接转化为结构化查询语言（SQL）语句。本文提出了一种称为 SpeechSQLNet 的新型端到端神经体系结构，该体系结构可以直接将人类的语音转化为 SQL 查询，而无需外部自动语音识别步骤。为验证所提出模型的有效性，另构建了一个名为 SpeechQL 的数据集，并展开了广泛的实验证明，证明 SpeechSQLNet 可以直接从人类语音中综合高质量的 SQL 查询，精确匹配准确性方面超越了各种竞争对手以及级联方法。

Jan, 2022

具备表格感知的单词语境综合 WikiSQL 探索

SQLova 是第一个在 WikiSQL 数据集中实现人类性能的自然语言到 SQL 模型，利用了 BERT 通过有效的表格语境方法，结合了多种流行的 NL2SQL 方法，在逻辑形式和执行准确度方面分别优于先前的最新技术水平 8.2％和 2.5％。我们特别注意到，在使用这样的大型预训练模型时，BERT 与序列到序列解码器会导致性能不佳，这表明设计的重要性。我们还对数据集和我们的模型进行了全面的分析，这可能有助于设计未来的 NL2SQL 数据集和模型。我们特别展示了我们模型的表现已经接近 WikiSQL 的上限，在其中我们观察到大部分评估错误是由于错误的注释，而我们的模型在执行准确度方面已经超过人类表现 1.3％。

Feb, 2019