使用模式依赖性学习改进文本到 SQL 的转换
该研究探讨了神经话语解析的问题,引入新的执行指南机制来利用 SQL 的语义,证明其普遍提高了基于自回归生成模型的语义解析模型的性能。
Jul, 2018
本研究提出了一种基于数据库架构图编码器的上下文相关文本到 SQL 任务模型,该模型使用历史用户输入的编码器和数据库架构项的历史信息,采用门控机制加权不同词汇的重要性,取得 SParC 数据集和 CoSQL 数据集上的最新最佳结果,并证明了该模型的实用性。
Nov, 2020
传统的文本到 SQL 解析器在合成涉及多个表格或列的复杂 SQL 查询方面表现不佳,为了解决这个问题,我们提出了一种面向模式的多任务学习框架(名为 MTSQL)来处理复杂的 SQL 查询。通过设计一个模式链接鉴别器模块来区分有效的问题 - 模式关联,明确指示编码器通过特殊的链接关系来增强对齐质量。在解码器方面,我们定义了 6 种关系类型来描述表格和列之间的连接,并引入以运算符为中心的三元抽取器来识别那些与预定义关系相关的模式项。此外,我们通过预测的三元组建立了一组语法约束规则集,用于在 SQL 生成过程中过滤适当的 SQL 运算符和模式项。在跨领域的具有挑战性的文本到 SQL 基准测试 Spider 上,实验结果表明 MTSQL 比基线方法更有效,特别是在极端困难的场景中。此外,进一步的分析验证了我们的方法在处理复杂 SQL 查询方面的有希望的改进。
Mar, 2024
本文提出了一种注入语法到问 - Schema 图编码器中用于 Text-to-SQL 解析器的方法 ——S$^2$SQL,它有效地利用了问题中的句法依赖信息来提高性能,并采用解耦约束来诱导多样化的关系边缘嵌入,实验结果在 Spider 和鲁棒性设置 Spider-Syn 上均表现优于所有现有方法,使性能在 Spider 排行榜上名列前茅。
Mar, 2022
本文提出一种名为 ISESL-SQL 的框架,通过具有迭代性的语义增强架构图方法,构建了问题单词和数据库模式之间的联系,提高文本到 SQL 系统的泛化能力。实验结果表明,ISESL-SQL 优于其他基准模型,并展示了其在多种数据库上的鲁棒性和泛化能力。
Aug, 2022
本文提出了一种处理 neural text-to-SQL models 中编写语法的复杂性的技术,从而生成 schema-dependent grammar,对 ATIS 和 Spider 两个挑战性的 text-to-SQL 数据集进行分析,显示可以减少 14-18% 的相对误差。
May, 2019
研究了如何将复杂的文本到 SQL 任务分解为较小的子任务,从而显著提高大型语言模型(LLMs)在推理过程中的性能,证明了将 SQL 查询分解为子问题并将这些子问题的解决方案提供给 LLMs 可以显著提高性能。在三个 LLMs 上的实验表明,此方法始终将性能提高约 10%,推动 LLMs 的准确性接近最先进水平,甚至超过用于持有 Spider 数据集的大型精调模型。
Apr, 2023
该研究提出了一种新的基于 ShadowGNN 的文本到 SQL 转化模型,通过抽象和语义级别处理数据库模式以提高模型对不常见和没有看到过的模式的泛化能力,并在 Text-to-SQL 基准测试中表现优异。
Apr, 2021
本文提出了一种基于图结构编码模型和 Dual-Graph 聚合机制的跨领域 Text-to-SQL 方法,在 Spider Text-to-SQL benchmark 中获得了第三名
Nov, 2021
该研究关注语言解析到 SQL 的过程,并提出了一种使用图神经网络对数据库模式进行编码的方法,在 Spider 数据集上得到了较高的解析准确率。
May, 2019