多轮文本到 SQL 语义解析的交互状态跟踪

AAAIDec, 2020

多轮文本到 SQL 语义解析的交互状态跟踪

Tracking Interaction States for Multi-Turn Text-to-SQL Semantic Parsing

Run-Ze Wang, Zhen-Hua Ling, Jing-Bo Zhou, Yu Hu

TL;DR本文提出一种基于关系图神经网络的文本转 SQL 语义解析模型，通过定义基于数据库模式项和关键词的交互状态并设计相应的更新机制，以实现更好的解析效果，在 CoSQL 数据集上表现优异。

Abstract

The task of multi-turn text-to-sql semantic parsing aims to translate natural language utterances in an interaction into SQL queries in order to answer them using a database which normally contains multiple table

text-to-sql semantic parsing interaction states graph neural network cosql

发现论文，激发创造

多轮文本到 SQL 的分离对话建模和语义解析

本研究提出了一种新的分离式多轮对话文本转 SQL 框架，使用话语重写模型和单轮 Text-to-SQL 解释器来解决对多轮对话历史建模和数据稀疏性问题，在无标注的情况下表现优异。

Jun, 2021

多关注历史记录：一种面向会话文本到 SQL 的上下文建模策略

本研究提出了两个对话建模任务，旨在辅助多轮对话语义解析。结果表明，在上下文总结和明确建模每个轮次的语义变化方面，可以极大提高多轮语义解析的性能。

Dec, 2021

基于模型的交互式语义解析：统一框架和文本到 SQL 的案例研究

本论文提出了一个新的交互式语义解析问题的统一形式，其中的目标是设计一个基于模型的智能代理。代理能够自主决定是否和何时需要人类干预，并生成自然语言的澄清问题，使用了世界模型并在两个 Text-to-SQL 数据集上得到了很好的效果。

Oct, 2019

面向会话的文本到 SQL 转换：现状和未来挑战的探索

通过多任务联合训练和模式重排应用于 text-to-SQL 任务中，可以显著提高模型的表现，进一步结合查询计划模型和模式链接算法后，T5-3B 的精确匹配和执行匹配的准确度均超过 SOTA 基线。

Feb, 2023

文本转 SQL 解析调查：概念，方法和未来方向

该研究综述了文本到结构化查询语言解析的深度学习方法，介绍了单轮和多轮对话的文本到 SQL 解析语料库，阐明了预训练语言模型和现有方法，探讨了面临的挑战和未来发展方向。

Aug, 2022

利用自我对弈增强多轮文本转 SQL 数据集

本文提出了一种通过自身游戏来增强训练集，再利用经过采样的目标查询生成新的交互来适应新的数据库的上下文依赖文本转 SQL 任务方法，并利用所得到的增强数据重新训练模型，实验表明，该方法在 SParC 和 CoSQL 两个广泛使用的跨领域文本转 SQL 数据集上显著提高了准确性。

Oct, 2022

HIE-SQL：基于历史信息增强的网络的上下文依存文本到 SQL 语义解析

本文提出了一种历史信息增强的文本转 SQL 模型（HIE-SQL），通过两种不同的模态（自然语言和 SQL）的双模态预训练模型来处理它们之间的不匹配，从而利用历史话语和最后预测的 SQL 查询中的上下文依赖信息，并设计了一个模式连接图来增强话语和 SQL 查询与数据库模式之间的联系。我们展示了历史信息增强方法显著提高了 HIE-SQL 的性能，在 SparC 和 CoSQL 数据集上取得了新的最优结果。

Mar, 2022

面向复杂文本到 SQL 的模式感知多任务学习

传统的文本到 SQL 解析器在合成涉及多个表格或列的复杂 SQL 查询方面表现不佳，为了解决这个问题，我们提出了一种面向模式的多任务学习框架（名为 MTSQL）来处理复杂的 SQL 查询。通过设计一个模式链接鉴别器模块来区分有效的问题 - 模式关联，明确指示编码器通过特殊的链接关系来增强对齐质量。在解码器方面，我们定义了 6 种关系类型来描述表格和列之间的连接，并引入以运算符为中心的三元抽取器来识别那些与预定义关系相关的模式项。此外，我们通过预测的三元组建立了一组语法约束规则集，用于在 SQL 生成过程中过滤适当的 SQL 运算符和模式项。在跨领域的具有挑战性的文本到 SQL 基准测试 Spider 上，实验结果表明 MTSQL 比基线方法更有效，特别是在极端困难的场景中。此外，进一步的分析验证了我们的方法在处理复杂 SQL 查询方面的有希望的改进。

Mar, 2024

基于数据库架构交互图的上下文相关文本到 SQL 生成的神经模型

本研究提出了一种基于数据库架构图编码器的上下文相关文本到 SQL 任务模型，该模型使用历史用户输入的编码器和数据库架构项的历史信息，采用门控机制加权不同词汇的重要性，取得 SParC 数据集和 CoSQL 数据集上的最新最佳结果，并证明了该模型的实用性。

Nov, 2020

S$^2$SQL：在文本到 SQL 解析器中注入语法以实现问题 - 架构交互图编码器

本文提出了一种注入语法到问 - Schema 图编码器中用于 Text-to-SQL 解析器的方法 ——S$^2$SQL，它有效地利用了问题中的句法依赖信息来提高性能，并采用解耦约束来诱导多样化的关系边缘嵌入，实验结果在 Spider 和鲁棒性设置 Spider-Syn 上均表现优于所有现有方法，使性能在 Spider 排行榜上名列前茅。

Mar, 2022