ShadowGNN: 面向文本到 SQL 解析器的图投影神经网络
该研究关注语言解析到 SQL 的过程,并提出了一种使用图神经网络对数据库模式进行编码的方法,在 Spider 数据集上得到了较高的解析准确率。
May, 2019
本文提出了一种注入语法到问 - Schema 图编码器中用于 Text-to-SQL 解析器的方法 ——S$^2$SQL,它有效地利用了问题中的句法依赖信息来提高性能,并采用解耦约束来诱导多样化的关系边缘嵌入,实验结果在 Spider 和鲁棒性设置 Spider-Syn 上均表现优于所有现有方法,使性能在 Spider 排行榜上名列前茅。
Mar, 2022
本研究针对语义解析器在零样本学习中难以正确选择新数据库常数集的问题,提出一种全局推理数据库常数集的解析器,采用图神经网络的消息传递机制,考虑问题的情境信息,软选择一部分数据库常数集,并通过训练模型根据数据库常数与问题单词的全局匹配度对解析结果排序。在面向包含复杂数据库的零样本语义解析数据集 Spider 中,我们将该方法应用于当前最先进模型,将准确率从 39.4%提高到 47.4%。
Aug, 2019
本研究提出了一种基于数据库架构图编码器的上下文相关文本到 SQL 任务模型,该模型使用历史用户输入的编码器和数据库架构项的历史信息,采用门控机制加权不同词汇的重要性,取得 SParC 数据集和 CoSQL 数据集上的最新最佳结果,并证明了该模型的实用性。
Nov, 2020
该研究使用基于关系感知自注意机制的统一框架,解决将自然语言问题转换为 SQL 查询中出现的通用性问题,包括编码数据库关系,建立数据库列和查询的链接,以及特征表示。在 Spider 数据集上,该框架将的精确匹配准确度提高到 57.2%,优于其最好的对手 8.7%的绝对改进,并在 BERT 的支持下,实现了 65.6%的性能,成为了新的最佳表现,同时也在模型对数据库链接和对齐的理解方面得到了定性改善。
Nov, 2019
本研究提出了一种混合模型 GRAPHIX-T5,使用特定的图形感知层来增强预训练的文本到文本 Transformer 模型 T5 在 text-to-SQL 解析任务上的性能,在四个 SQL 基准测试中均获得更好的结果,尤其是在 EM 和 EX 方面快速准确地超越了 T5-3B。
Jan, 2023
本文提出了一种基于图结构编码模型和 Dual-Graph 聚合机制的跨领域 Text-to-SQL 方法,在 Spider Text-to-SQL benchmark 中获得了第三名
Nov, 2021
本文提出一种名为 ISESL-SQL 的框架,通过具有迭代性的语义增强架构图方法,构建了问题单词和数据库模式之间的联系,提高文本到 SQL 系统的泛化能力。实验结果表明,ISESL-SQL 优于其他基准模型,并展示了其在多种数据库上的鲁棒性和泛化能力。
Aug, 2022
传统的文本到 SQL 解析器在合成涉及多个表格或列的复杂 SQL 查询方面表现不佳,为了解决这个问题,我们提出了一种面向模式的多任务学习框架(名为 MTSQL)来处理复杂的 SQL 查询。通过设计一个模式链接鉴别器模块来区分有效的问题 - 模式关联,明确指示编码器通过特殊的链接关系来增强对齐质量。在解码器方面,我们定义了 6 种关系类型来描述表格和列之间的连接,并引入以运算符为中心的三元抽取器来识别那些与预定义关系相关的模式项。此外,我们通过预测的三元组建立了一组语法约束规则集,用于在 SQL 生成过程中过滤适当的 SQL 运算符和模式项。在跨领域的具有挑战性的文本到 SQL 基准测试 Spider 上,实验结果表明 MTSQL 比基线方法更有效,特别是在极端困难的场景中。此外,进一步的分析验证了我们的方法在处理复杂 SQL 查询方面的有希望的改进。
Mar, 2024
本篇论文提出了一种基于 Schema Dependency 的多任务 Text-to-SQL 模型(SDSQL),用于有效捕获问题和架构之间的交互,从而减少数据库执行所拖延的推理时间,具有更好的可扩展性和更高的性能。
Mar, 2021