探索上下文依赖文本到 SQL 解析中的组合泛化

ACLMay, 2023

探索上下文依赖文本到 SQL 解析中的组合泛化

Exploring the Compositional Generalization in Context Dependent Text-to-SQL Parsing

Aiwei Liu, Wei Liu, Xuming Hu, Shuang Li, Fukun Ma...

TL;DR该文研究了文本到 SQL 的组成归纳泛化问题，通过提出新的标准数据集 CoSQL-CG 和 SParC-CG，提出了一种基于 p-align 的改进方法，并证明了其有效性。

Abstract

In the context-dependent text-to-sql task, the generated SQL statements are refined iteratively based on the user input utterance from each interaction. The input text from each →

text-to-sql compositional generalization benchmarks p-align interaction

发现论文，激发创造

通过组件对齐测量和提高文本到 SQL 中的组合通用性

本文介绍了如何通过分句和 SQL 子句的注释构造一个新的数据集 Spider-SS，然后将 sub-sentences 不同组合构成一个新的数据集 Spider-CG，用于测试模型的组成泛化能力。实验表明，现有模型在 Spider-CG 上表现出显著的性能下降，我们改进了一些最先进的模型在 Spider-SS 上进行训练，提高了泛化性能。

May, 2022

通用且鲁棒的文本到 SQL 解析

研究 text-to-SQL parsing 在三个层面的泛化性和抗扰性，提出 TKK framework 用于学习 text-to-SQL parsing，该框架在多个测试数据集上表现出了显著的效果。

Oct, 2022

文本转 SQL 中结构概括的研究

本文讨论了文本到 SQL 任务的结构概括问题。通过研究现有数据集和实验结果，我们观察到了（自然语言，SQL）模式过分拟合的实践限制。

Jan, 2023

大型语言模型中面向组合通用语义解析的研究综述

本文对最近在分析、方法和评估方案上的进展进行了综述，为从业者和研究人员在这一领域提供了一个起点。

Apr, 2024

数据到文本生成的组合推广

数据到文本生成涉及将结构化数据转化为连贯的文本描述，本论文提出了一种解决复合概括问题的新模型，通过将谓词聚类成组，在生成文本时逐句依赖于一组谓词，显著优于基线模型 T5 的各种评估指标，尤其在维护对输入的忠实度指标上提升了 31%。

Dec, 2023

适应和分解：通过领域调整的从少到多提示进行文本转 SQL 的高效泛化

基于大型语言模型和通用提示的适应和分解方法在 Text-to-SQL 语义解析任务中表现出卓越的性能，并在 KaggleDBQA 数据集上展现了跨领域和跨组合通用性的一致性改进。

Aug, 2023

组合推理需要组合分析器

该研究系统比较了序列到序列模型和基于组合原则的模型在 COGS 语料库上处理组合泛化能力的能力，在结构泛化任务中，基于序列的模型表现接近零，而组成模型在结构泛化任务中表现接近完美，这表明结构泛化是组成泛化的关键度量，需要能够处理复杂结构的模型。

Feb, 2022

基于两种简单的语义边界技术，提高基于语言模型的文本到 SQL 语义分析的泛化能力

本研究着重于解决语义分析中的组成和领域通用性问题，尝试改进基于预训练语言模型的语义解析器的泛化能力，并通过两种简单的方法，在标记化处理等方面达到了实验效果的显著提升。

May, 2023

通过增加自然语言变化提升语义解析的泛化能力

使用数据增强来增强文本到 SQL 解析器对自然语言变化的鲁棒性，通过大型语言模型生成更真实和多样化的问题，从而在评估集合中实现显著的改进。

Feb, 2024

语法指导的 Transformer: 在多模态环境中提升组合泛化能力和基于语境的理解

利用句法结构的注意力屏蔽技术从根本上提高了组合概括的重要性，特别是在多模式环境中的语义根基问题。通过在 Transformer 编码器中的权重共享，依赖解析在不同任务中推动了基于语法的组合概括的最新研究。这些结果提高了多模式语义根基和参数高效建模的技术水平，并为未来的研究提供了深入洞察。

Nov, 2023