RESDSQL: 文本到 SQL 的模式连接和骨架解析分离技术

AAAIFeb, 2023

RESDSQL: 文本到 SQL 的模式连接和骨架解析分离技术

RESDSQL: Decoupling Schema Linking and Skeleton Parsing for Text-to-SQL

Haoyang Li, Jing Zhang, Cuiping Li, Hong Chen

TL;DR本研究提出一种基于预训练语言模型的 Text-to-SQL 模型，结合排序增强编码和骨架感知解码框架的方法，以解耦数据库模式连接和 SQL 关键字解析，实验表明该模型在 Spider 数据集上表现良好。

Abstract

One of the recent best attempts at text-to-sql is the pre-trained language model. Due to the structural property of the sql queries, the seq2seq model takes the responsibility of parsing both the schema items (i.

text-to-sql pre-trained language model sql queries ranking-enhanced encoding spider

发现论文，激发创造

RAT-SQL：基于关系感知的文本 - SQL 解析器的模式编码和链接

该研究使用基于关系感知自注意机制的统一框架，解决将自然语言问题转换为 SQL 查询中出现的通用性问题，包括编码数据库关系，建立数据库列和查询的链接，以及特征表示。在 Spider 数据集上，该框架将的精确匹配准确度提高到 57.2％，优于其最好的对手 8.7％的绝对改进，并在 BERT 的支持下，实现了 65.6％的性能，成为了新的最佳表现，同时也在模型对数据库链接和对齐的理解方面得到了定性改善。

Nov, 2019

面向复杂文本到 SQL 的模式感知多任务学习

传统的文本到 SQL 解析器在合成涉及多个表格或列的复杂 SQL 查询方面表现不佳，为了解决这个问题，我们提出了一种面向模式的多任务学习框架（名为 MTSQL）来处理复杂的 SQL 查询。通过设计一个模式链接鉴别器模块来区分有效的问题 - 模式关联，明确指示编码器通过特殊的链接关系来增强对齐质量。在解码器方面，我们定义了 6 种关系类型来描述表格和列之间的连接，并引入以运算符为中心的三元抽取器来识别那些与预定义关系相关的模式项。此外，我们通过预测的三元组建立了一组语法约束规则集，用于在 SQL 生成过程中过滤适当的 SQL 运算符和模式项。在跨领域的具有挑战性的文本到 SQL 基准测试 Spider 上，实验结果表明 MTSQL 比基线方法更有效，特别是在极端困难的场景中。此外，进一步的分析验证了我们的方法在处理复杂 SQL 查询方面的有希望的改进。

Mar, 2024

T5-SR: 一种用于语义解析的统一 Seq-to-Seq 解码策略

该篇论文分析了语义解析 (seq2seq) 面临的挑战，如预测语义信息和处理自然语言查询和 SQL 之间的语义连贯性，并提出一种名为 SR 的解码策略，包括一种新的中间表示 (SSQL) 和用于解决这些难题的得分再评估的 reranking 方法。实验证明，该方法在 Spider 数据集上取得了最新的最先进的结果 (T5-SR-3b)。

Jun, 2023

使用图神经网络表示模式结构，用于文本到 SQL 解析

该研究关注语言解析到 SQL 的过程，并提出了一种使用图神经网络对数据库模式进行编码的方法，在 Spider 数据集上得到了较高的解析准确率。

May, 2019

使用模式依赖性学习改进文本到 SQL 的转换

本篇论文提出了一种基于 Schema Dependency 的多任务 Text-to-SQL 模型（SDSQL），用于有效捕获问题和架构之间的交互，从而减少数据库执行所拖延的推理时间，具有更好的可扩展性和更高的性能。

Mar, 2021

S$^2$SQL：在文本到 SQL 解析器中注入语法以实现问题 - 架构交互图编码器

本文提出了一种注入语法到问 - Schema 图编码器中用于 Text-to-SQL 解析器的方法 ——S$^2$SQL，它有效地利用了问题中的句法依赖信息来提高性能，并采用解耦约束来诱导多样化的关系边缘嵌入，实验结果在 Spider 和鲁棒性设置 Spider-Syn 上均表现优于所有现有方法，使性能在 Spider 排行榜上名列前茅。

Mar, 2022

两种连结的故事：在文本转 SQL 解析中动态门控模式的模式连接和结构连接之间切换

提出了一种使用门控机制动态选择连接过程、将两种连接过程集成到两个基于图神经网络的语义解析器中，并与 BERT 表征一起演示在具有挑战性的 Spider 数据集上的显著性能提升，该方法有助于增强模型输出的结构并提供更可解释的预测。

Sep, 2020

通过迭代学习模式链接图来提升语义文本到 SQL 解析能力

本文提出一种名为 ISESL-SQL 的框架，通过具有迭代性的语义增强架构图方法，构建了问题单词和数据库模式之间的联系，提高文本到 SQL 系统的泛化能力。实验结果表明，ISESL-SQL 优于其他基准模型，并展示了其在多种数据库上的鲁棒性和泛化能力。

Aug, 2022

基于语法的神经网络文本到 SQL 生成

本文提出了一种处理 neural text-to-SQL models 中编写语法的复杂性的技术，从而生成 schema-dependent grammar，对 ATIS 和 Spider 两个挑战性的 text-to-SQL 数据集进行分析，显示可以减少 14-18% 的相对误差。

May, 2019

基于架构感知去噪的端到端文本到 SQL 生成

该研究提出一种基于 transformer-based seq-to-seq 模型的简单而有效的方法，通过 Schema aware Denoising（SeaD）对模型进行训练以更好地对结构化数据进行建模，并提出了一种 clause-sensitive execution guided (EG) 解码策略来克服生成模型的 EG 解码的局限性，实现了在 WikiSQL 基准测试中的最新性能。

May, 2021