探索上下文依赖文本到 SQL 解析中的组合泛化
本文介绍了如何通过分句和 SQL 子句的注释构造一个新的数据集 Spider-SS,然后将 sub-sentences 不同组合构成一个新的数据集 Spider-CG,用于测试模型的组成泛化能力。实验表明,现有模型在 Spider-CG 上表现出显著的性能下降,我们改进了一些最先进的模型在 Spider-SS 上进行训练,提高了泛化性能。
May, 2022
研究 text-to-SQL parsing 在三个层面的泛化性和抗扰性,提出 TKK framework 用于学习 text-to-SQL parsing,该框架在多个测试数据集上表现出了显著的效果。
Oct, 2022
数据到文本生成涉及将结构化数据转化为连贯的文本描述,本论文提出了一种解决复合概括问题的新模型,通过将谓词聚类成组,在生成文本时逐句依赖于一组谓词,显著优于基线模型 T5 的各种评估指标,尤其在维护对输入的忠实度指标上提升了 31%。
Dec, 2023
基于大型语言模型和通用提示的适应和分解方法在 Text-to-SQL 语义解析任务中表现出卓越的性能,并在 KaggleDBQA 数据集上展现了跨领域和跨组合通用性的一致性改进。
Aug, 2023
该研究系统比较了序列到序列模型和基于组合原则的模型在 COGS 语料库上处理组合泛化能力的能力,在结构泛化任务中,基于序列的模型表现接近零,而组成模型在结构泛化任务中表现接近完美,这表明结构泛化是组成泛化的关键度量,需要能够处理复杂结构的模型。
Feb, 2022
本研究着重于解决语义分析中的组成和领域通用性问题,尝试改进基于预训练语言模型的语义解析器的泛化能力,并通过两种简单的方法,在标记化处理等方面达到了实验效果的显著提升。
May, 2023
利用句法结构的注意力屏蔽技术从根本上提高了组合概括的重要性,特别是在多模式环境中的语义根基问题。通过在 Transformer 编码器中的权重共享,依赖解析在不同任务中推动了基于语法的组合概括的最新研究。这些结果提高了多模式语义根基和参数高效建模的技术水平,并为未来的研究提供了深入洞察。
Nov, 2023