通过迭代学习模式链接图来提升语义文本到 SQL 解析能力
本论文提出了一种新的框架,基于 Poincaré 距离度量,通过探测程序从大规模预训练的语言模型中引出关系结构,以加强当前基于图的解析器,进而实现更好的模式链接。
Jun, 2022
传统的文本到 SQL 解析器在合成涉及多个表格或列的复杂 SQL 查询方面表现不佳,为了解决这个问题,我们提出了一种面向模式的多任务学习框架(名为 MTSQL)来处理复杂的 SQL 查询。通过设计一个模式链接鉴别器模块来区分有效的问题 - 模式关联,明确指示编码器通过特殊的链接关系来增强对齐质量。在解码器方面,我们定义了 6 种关系类型来描述表格和列之间的连接,并引入以运算符为中心的三元抽取器来识别那些与预定义关系相关的模式项。此外,我们通过预测的三元组建立了一组语法约束规则集,用于在 SQL 生成过程中过滤适当的 SQL 运算符和模式项。在跨领域的具有挑战性的文本到 SQL 基准测试 Spider 上,实验结果表明 MTSQL 比基线方法更有效,特别是在极端困难的场景中。此外,进一步的分析验证了我们的方法在处理复杂 SQL 查询方面的有希望的改进。
Mar, 2024
提出了一种使用门控机制动态选择连接过程、将两种连接过程集成到两个基于图神经网络的语义解析器中,并与 BERT 表征一起演示在具有挑战性的 Spider 数据集上的显著性能提升,该方法有助于增强模型输出的结构并提供更可解释的预测。
Sep, 2020
本文提出了一种注入语法到问 - Schema 图编码器中用于 Text-to-SQL 解析器的方法 ——S$^2$SQL,它有效地利用了问题中的句法依赖信息来提高性能,并采用解耦约束来诱导多样化的关系边缘嵌入,实验结果在 Spider 和鲁棒性设置 Spider-Syn 上均表现优于所有现有方法,使性能在 Spider 排行榜上名列前茅。
Mar, 2022
使用 CodeLlama-34B 建立了一种创新的模式链接方法,通过从初始 SQL 查询中提取表格和列,创建了一个简明的架构,并且在与主流方法对比的情况下,在 SQL 生成方面表现最佳。利用 GPT4,在 Spider 数据集上实现了与主流 Text-to-SQL 方法相媲美的结果。
May, 2024
该论文提出了一种基于关系嵌入的半自回归语义分析 NL2SQL 方法,通过 ELECTRA 和关系感知 transformer 层实现与模式实体及问题单词之间的关系嵌入,再使用半自回归解析器和预定义的 SQL 语法解码查询 SQL,从实验结果和案例研究来看,该方法在 NL2SQL 中具有更好的词汇表现力。
Aug, 2021
本文提出了一种基于标记级精细化查询理解的通用、模块化的神经语义分析框架,包括命名实体识别器(NER)、神经实体链接器(NEL)和神经语义解析器(NSP),该框架联合建模查询和数据库,并基于动态生成的语法合成基于树结构的 SQL 查询。实验证明,该模型在 SQUALL 数据集上的执行准确率达到了 56.8%,超过了现有技术水平 2.7%。
Sep, 2022
本文提出了一种历史信息增强的文本转 SQL 模型(HIE-SQL),通过两种不同的模态(自然语言和 SQL)的双模态预训练模型来处理它们之间的不匹配,从而利用历史话语和最后预测的 SQL 查询中的上下文依赖信息,并设计了一个模式连接图来增强话语和 SQL 查询与数据库模式之间的联系。我们展示了历史信息增强方法显著提高了 HIE-SQL 的性能,在 SparC 和 CoSQL 数据集上取得了新的最优结果。
Mar, 2022
该研究使用基于关系感知自注意机制的统一框架,解决将自然语言问题转换为 SQL 查询中出现的通用性问题,包括编码数据库关系,建立数据库列和查询的链接,以及特征表示。在 Spider 数据集上,该框架将的精确匹配准确度提高到 57.2%,优于其最好的对手 8.7%的绝对改进,并在 BERT 的支持下,实现了 65.6%的性能,成为了新的最佳表现,同时也在模型对数据库链接和对齐的理解方面得到了定性改善。
Nov, 2019
本篇论文提出了一种基于 Schema Dependency 的多任务 Text-to-SQL 模型(SDSQL),用于有效捕获问题和架构之间的交互,从而减少数据库执行所拖延的推理时间,具有更好的可扩展性和更高的性能。
Mar, 2021