多轮文本到 SQL 语义解析的交互状态跟踪
本研究提出了一种新的分离式多轮对话文本转 SQL 框架,使用话语重写模型和单轮 Text-to-SQL 解释器来解决对多轮对话历史建模和数据稀疏性问题,在无标注的情况下表现优异。
Jun, 2021
本研究提出了两个对话建模任务,旨在辅助多轮对话语义解析。结果表明,在上下文总结和明确建模每个轮次的语义变化方面,可以极大提高多轮语义解析的性能。
Dec, 2021
本论文提出了一个新的交互式语义解析问题的统一形式,其中的目标是设计一个基于模型的智能代理。代理能够自主决定是否和何时需要人类干预,并生成自然语言的澄清问题,使用了世界模型并在两个 Text-to-SQL 数据集上得到了很好的效果。
Oct, 2019
通过多任务联合训练和模式重排应用于 text-to-SQL 任务中,可以显著提高模型的表现,进一步结合查询计划模型和模式链接算法后,T5-3B 的精确匹配和执行匹配的准确度均超过 SOTA 基线。
Feb, 2023
该研究综述了文本到结构化查询语言解析的深度学习方法,介绍了单轮和多轮对话的文本到 SQL 解析语料库,阐明了预训练语言模型和现有方法,探讨了面临的挑战和未来发展方向。
Aug, 2022
本文提出了一种通过自身游戏来增强训练集,再利用经过采样的目标查询生成新的交互来适应新的数据库的上下文依赖文本转 SQL 任务方法,并利用所得到的增强数据重新训练模型,实验表明,该方法在 SParC 和 CoSQL 两个广泛使用的跨领域文本转 SQL 数据集上显著提高了准确性。
Oct, 2022
本文提出了一种历史信息增强的文本转 SQL 模型(HIE-SQL),通过两种不同的模态(自然语言和 SQL)的双模态预训练模型来处理它们之间的不匹配,从而利用历史话语和最后预测的 SQL 查询中的上下文依赖信息,并设计了一个模式连接图来增强话语和 SQL 查询与数据库模式之间的联系。我们展示了历史信息增强方法显著提高了 HIE-SQL 的性能,在 SparC 和 CoSQL 数据集上取得了新的最优结果。
Mar, 2022
传统的文本到 SQL 解析器在合成涉及多个表格或列的复杂 SQL 查询方面表现不佳,为了解决这个问题,我们提出了一种面向模式的多任务学习框架(名为 MTSQL)来处理复杂的 SQL 查询。通过设计一个模式链接鉴别器模块来区分有效的问题 - 模式关联,明确指示编码器通过特殊的链接关系来增强对齐质量。在解码器方面,我们定义了 6 种关系类型来描述表格和列之间的连接,并引入以运算符为中心的三元抽取器来识别那些与预定义关系相关的模式项。此外,我们通过预测的三元组建立了一组语法约束规则集,用于在 SQL 生成过程中过滤适当的 SQL 运算符和模式项。在跨领域的具有挑战性的文本到 SQL 基准测试 Spider 上,实验结果表明 MTSQL 比基线方法更有效,特别是在极端困难的场景中。此外,进一步的分析验证了我们的方法在处理复杂 SQL 查询方面的有希望的改进。
Mar, 2024
本研究提出了一种基于数据库架构图编码器的上下文相关文本到 SQL 任务模型,该模型使用历史用户输入的编码器和数据库架构项的历史信息,采用门控机制加权不同词汇的重要性,取得 SParC 数据集和 CoSQL 数据集上的最新最佳结果,并证明了该模型的实用性。
Nov, 2020
本文提出了一种注入语法到问 - Schema 图编码器中用于 Text-to-SQL 解析器的方法 ——S$^2$SQL,它有效地利用了问题中的句法依赖信息来提高性能,并采用解耦约束来诱导多样化的关系边缘嵌入,实验结果在 Spider 和鲁棒性设置 Spider-Syn 上均表现优于所有现有方法,使性能在 Spider 排行榜上名列前茅。
Mar, 2022