RESDSQL: 文本到 SQL 的模式连接和骨架解析分离技术
该研究使用基于关系感知自注意机制的统一框架,解决将自然语言问题转换为 SQL 查询中出现的通用性问题,包括编码数据库关系,建立数据库列和查询的链接,以及特征表示。在 Spider 数据集上,该框架将的精确匹配准确度提高到 57.2%,优于其最好的对手 8.7%的绝对改进,并在 BERT 的支持下,实现了 65.6%的性能,成为了新的最佳表现,同时也在模型对数据库链接和对齐的理解方面得到了定性改善。
Nov, 2019
传统的文本到 SQL 解析器在合成涉及多个表格或列的复杂 SQL 查询方面表现不佳,为了解决这个问题,我们提出了一种面向模式的多任务学习框架(名为 MTSQL)来处理复杂的 SQL 查询。通过设计一个模式链接鉴别器模块来区分有效的问题 - 模式关联,明确指示编码器通过特殊的链接关系来增强对齐质量。在解码器方面,我们定义了 6 种关系类型来描述表格和列之间的连接,并引入以运算符为中心的三元抽取器来识别那些与预定义关系相关的模式项。此外,我们通过预测的三元组建立了一组语法约束规则集,用于在 SQL 生成过程中过滤适当的 SQL 运算符和模式项。在跨领域的具有挑战性的文本到 SQL 基准测试 Spider 上,实验结果表明 MTSQL 比基线方法更有效,特别是在极端困难的场景中。此外,进一步的分析验证了我们的方法在处理复杂 SQL 查询方面的有希望的改进。
Mar, 2024
该篇论文分析了语义解析 (seq2seq) 面临的挑战,如预测语义信息和处理自然语言查询和 SQL 之间的语义连贯性,并提出一种名为 SR 的解码策略,包括一种新的中间表示 (SSQL) 和用于解决这些难题的得分再评估的 reranking 方法。实验证明,该方法在 Spider 数据集上取得了最新的最先进的结果 (T5-SR-3b)。
Jun, 2023
该研究关注语言解析到 SQL 的过程,并提出了一种使用图神经网络对数据库模式进行编码的方法,在 Spider 数据集上得到了较高的解析准确率。
May, 2019
本篇论文提出了一种基于 Schema Dependency 的多任务 Text-to-SQL 模型(SDSQL),用于有效捕获问题和架构之间的交互,从而减少数据库执行所拖延的推理时间,具有更好的可扩展性和更高的性能。
Mar, 2021
本文提出了一种注入语法到问 - Schema 图编码器中用于 Text-to-SQL 解析器的方法 ——S$^2$SQL,它有效地利用了问题中的句法依赖信息来提高性能,并采用解耦约束来诱导多样化的关系边缘嵌入,实验结果在 Spider 和鲁棒性设置 Spider-Syn 上均表现优于所有现有方法,使性能在 Spider 排行榜上名列前茅。
Mar, 2022
提出了一种使用门控机制动态选择连接过程、将两种连接过程集成到两个基于图神经网络的语义解析器中,并与 BERT 表征一起演示在具有挑战性的 Spider 数据集上的显著性能提升,该方法有助于增强模型输出的结构并提供更可解释的预测。
Sep, 2020
本文提出一种名为 ISESL-SQL 的框架,通过具有迭代性的语义增强架构图方法,构建了问题单词和数据库模式之间的联系,提高文本到 SQL 系统的泛化能力。实验结果表明,ISESL-SQL 优于其他基准模型,并展示了其在多种数据库上的鲁棒性和泛化能力。
Aug, 2022
本文提出了一种处理 neural text-to-SQL models 中编写语法的复杂性的技术,从而生成 schema-dependent grammar,对 ATIS 和 Spider 两个挑战性的 text-to-SQL 数据集进行分析,显示可以减少 14-18% 的相对误差。
May, 2019
该研究提出一种基于 transformer-based seq-to-seq 模型的简单而有效的方法,通过 Schema aware Denoising(SeaD)对模型进行训练以更好地对结构化数据进行建模,并提出了一种 clause-sensitive execution guided (EG) 解码策略来克服生成模型的 EG 解码的局限性,实现了在 WikiSQL 基准测试中的最新性能。
May, 2021