使用图神经网络表示模式结构,用于文本到 SQL 解析
该研究提出了一种新的基于 ShadowGNN 的文本到 SQL 转化模型,通过抽象和语义级别处理数据库模式以提高模型对不常见和没有看到过的模式的泛化能力,并在 Text-to-SQL 基准测试中表现优异。
Apr, 2021
该研究使用基于关系感知自注意机制的统一框架,解决将自然语言问题转换为 SQL 查询中出现的通用性问题,包括编码数据库关系,建立数据库列和查询的链接,以及特征表示。在 Spider 数据集上,该框架将的精确匹配准确度提高到 57.2%,优于其最好的对手 8.7%的绝对改进,并在 BERT 的支持下,实现了 65.6%的性能,成为了新的最佳表现,同时也在模型对数据库链接和对齐的理解方面得到了定性改善。
Nov, 2019
本研究针对语义解析器在零样本学习中难以正确选择新数据库常数集的问题,提出一种全局推理数据库常数集的解析器,采用图神经网络的消息传递机制,考虑问题的情境信息,软选择一部分数据库常数集,并通过训练模型根据数据库常数与问题单词的全局匹配度对解析结果排序。在面向包含复杂数据库的零样本语义解析数据集 Spider 中,我们将该方法应用于当前最先进模型,将准确率从 39.4%提高到 47.4%。
Aug, 2019
本文提出了一种注入语法到问 - Schema 图编码器中用于 Text-to-SQL 解析器的方法 ——S$^2$SQL,它有效地利用了问题中的句法依赖信息来提高性能,并采用解耦约束来诱导多样化的关系边缘嵌入,实验结果在 Spider 和鲁棒性设置 Spider-Syn 上均表现优于所有现有方法,使性能在 Spider 排行榜上名列前茅。
Mar, 2022
本研究提出了一种基于数据库架构图编码器的上下文相关文本到 SQL 任务模型,该模型使用历史用户输入的编码器和数据库架构项的历史信息,采用门控机制加权不同词汇的重要性,取得 SParC 数据集和 CoSQL 数据集上的最新最佳结果,并证明了该模型的实用性。
Nov, 2020
本文提出了一种处理 neural text-to-SQL models 中编写语法的复杂性的技术,从而生成 schema-dependent grammar,对 ATIS 和 Spider 两个挑战性的 text-to-SQL 数据集进行分析,显示可以减少 14-18% 的相对误差。
May, 2019
通过使用自我关联,让编码器理解表格和列之间的关系,以及将该信息使用在问题的解释过程中,使得神经编码器 - 解码器系统能够在 SQL 查询的实现上具有较好的泛化性,从而在 Spider 数据集上获得 42.94% 的精确匹配准确率。
Jun, 2019
提出了一种利用自然语言反馈进行语义解析更正的方法,通过将任务的语义和语法困难分离,只需一轮自然语言反馈即可将文本到 SQL 解析器的准确性提高 26%;同时表明 T5-base 模型能在无需训练的情况下,纠正 T5-large 模型的错误。
May, 2023
本研究提出一种基于预训练语言模型的 Text-to-SQL 模型,结合排序增强编码和骨架感知解码框架的方法,以解耦数据库模式连接和 SQL 关键字解析,实验表明该模型在 Spider 数据集上表现良好。
Feb, 2023
本研究考虑将自然语言转换成 SQL,用于关系数据库的数据检索。我们提出了一种新的编码 - 解码框架,包括新的语义特征和语法感知状态等新方法。实证评估结果表明,我们的方法在真实世界的数据库和查询上明显优于现有技术。
Nov, 2017