使用强化学习从自然语言生成结构化查询的 Seq2SQL 模型
本文提出了一种新的方法,即 SQLNet,通过避免不必要的序列结构来基本解决序列化时的顺序问题,并结合依赖图、序列-集合模型和列注意力机制,可以在 WikiSQL 任务中比之前的方法提高 9% 到 13% 的效果。
Nov, 2017
利用 T5 模型进行文本转 SQL,结合问题增值和自动生成的银标识训练数据,实现了较高的 SQL 执行精度,并接近基于逻辑形式的最新的具有 SOTA 性能系统。
Nov, 2020
本研究考虑将自然语言转换成 SQL,用于关系数据库的数据检索。我们提出了一种新的编码 - 解码框架,包括新的语义特征和语法感知状态等新方法。实证评估结果表明,我们的方法在真实世界的数据库和查询上明显优于现有技术。
Nov, 2017
本文提出了一种将 SQL 查询表示为有向图的策略,并采用图到序列模型将全局结构信息编码成节点嵌入的方法,从而有效地学习 SQL 查询模式和其解释之间的相关性,实验结果表明,我们的模型在 WikiSQL 数据集和 Stackoverflow 数据集上表现显著优于 Seq2Seq 和 Tree2Seq 基线模型,达到了最先进的性能水平。
Sep, 2018
该论文探究了自然语言生成 SQL 查询的问题,并使用综合方法设计了三个深度神经网络,应用双向注意机制和卷积神经网络的字符级嵌入来提高结果,最终在 WikiSQL 数据集上达到了最先进的结果。
Dec, 2017
利用生成模型将自然语言问题转换成 SQL 查询,并通过考虑表格结构和 SQL 语法来提高查询的可执行性和准确性。在 WikiSQL 数据集上进行实验,将执行准确率从 69.0%提高到 74.4%。
Apr, 2018
本文研究了使用自然语言作为桥梁,通过有效访问数据库创建一个高效的文本到 SQL 模型,重点探讨了 24 个不同神经网络模型以及 11 个常用数据集的特点和局限性,最终讨论了 Text2SQL 技术在实现无缝数据查询方面的可能性。
Aug, 2022
本文旨在设计更有效的语音接口,以便查询关系型数据库中的结构化数据。首先引入了一种名为 Speech-to-SQL 的任务,该任务旨在理解由人类发音传达的信息,并将其直接转化为结构化查询语言(SQL)语句。本文提出了一种称为 SpeechSQLNet 的新型端到端神经体系结构,该体系结构可以直接将人类的语音转化为 SQL 查询,而无需外部自动语音识别步骤。为验证所提出模型的有效性,另构建了一个名为 SpeechQL 的数据集,并展开了广泛的实验证明,证明 SpeechSQLNet 可以直接从人类语音中综合高质量的 SQL 查询,精确匹配准确性方面超越了各种竞争对手以及级联方法。
Jan, 2022
SQLova 是第一个在 WikiSQL 数据集中实现人类性能的自然语言到 SQL 模型,利用了 BERT 通过有效的表格语境方法,结合了多种流行的 NL2SQL 方法,在逻辑形式和执行准确度方面分别优于先前的最新技术水平 8.2%和 2.5%。我们特别注意到,在使用这样的大型预训练模型时,BERT 与序列到序列解码器会导致性能不佳,这表明设计的重要性。我们还对数据集和我们的模型进行了全面的分析,这可能有助于设计未来的 NL2SQL 数据集和模型。我们特别展示了我们模型的表现已经接近 WikiSQL 的上限,在其中我们观察到大部分评估错误是由于错误的注释,而我们的模型在执行准确度方面已经超过人类表现 1.3%。
Feb, 2019