关于可证明长度和组合泛化性的研究

Feb, 2024

关于可证明长度和组合泛化性的研究

On Provable Length and Compositional Generalization

Kartik Ahuja, Amin Mansouri

TL;DR通过针对不同架构（包括深度集合、转换器、状态空间模型和简单循环神经网络）的研究，我们首次提出了能够证明长度和组合泛化的方法，并证明了对于长度和组合泛化，需要不同程度的表示识别，如与地面真实表示的线性或排列关系。

Abstract

length generalization -- the ability to generalize to longer sequences than ones seen during training, and compositional generalization -- the ability to generalize to token combinations not seen during training,

length generalization compositional generalization sequence-to-sequence models architecture representation identification

发现论文，激发创造

大型语言模型中的长度泛化探究

该研究探讨了基于 transformer 的语言模型的长度推广能力，发现预训练大语言模型的上下文学习能力与记事本提示相结合能大大改善长度推广，并鉴别了错误的共同来源，为赋予语言模型推广到更长问题的能力提供了新的机会。

Jul, 2022

神经序列模型的组合泛化能力再探讨

本文针对基础的 seq-to-seq 模型缺乏组合概括能力的问题，重点讨论了使用一次性原语概括来增强这种能力的方法，发现通过修改训练数据的方式，能够使标准的 seq-to-seq 模型实现接近完美的概括能力表现，并且对该现象进行了详细的实证分析，指出了模型的概括性能对于训练数据的特征非常敏感，因而应该在设计这样的基准测试时仔细考虑训练数据的选择。

Mar, 2022

基于分解的序列到序列学习的真实世界组合通用化

通过对 Disentangled sequence-to-sequence 模型进行改进，我们引入了两个关键的修改，以更好地处理语言中的组合概括，从而在现有任务和数据集上实现更好的泛化性能，并创造了一个新的机器翻译基准，并展示了这种方法比人工设计呈现更好的真实通用性。

Dec, 2022

重塑熟悉：测试循环网络的组合泛化能力

研究表明，在小范围模拟的语言理解任务中，seq2seq 模型具有很强的单词和短语的组合能力，但是当需要推导出新的组合规则时，模型的表现则很糟糕，需要更多的训练。

Jul, 2018

通过结构标注提高分类任务中的组合泛化能力

本文研究了复合推理在分类任务中的应用，并提出结构提示（如句法树和实体链接）对于解决神经模型复合推理问题具有较好的效果。

Jun, 2021

Transformer 模型可以实现长度概括，但不具备鲁棒性

使用适当的数据格式和位置编码的组合，本研究首次展示了标准 Transformers 在能够外推到输入长度 2.5 倍的序列长度方面的成功，然而与内分布泛化不同，长度泛化仍然是脆弱的，受到随机权重初始化和训练数据顺序等因素的显著影响，导致不同随机种子之间存在较大差异。

Feb, 2024

使用中间表示解锁预训练模型中的组合概括能力

通过使用中间表示法，这篇研究提出了一种改善基于预训练的 seq2seq 模型的组合泛化能力的有效方法，该方法在 CFQ 数据集上表现出新的最优水平（精度提高 14.8 个百分点），在三个 text-to-SQL 数据集的示例分割上精度提高了 15.0 到 19.4 个百分点。

Apr, 2021

用于组合泛化的解开序列生成的学习模型

本文提出了一种基于源输入逐步自适应重编码的 sequence-to-sequence 模型扩展，以此来鼓励解开编码时存在的混淆状态。最终实验结果表明，这个扩展能够提供更好的解释性和推广性。

Oct, 2021

组合推理需要组合分析器

该研究系统比较了序列到序列模型和基于组合原则的模型在 COGS 语料库上处理组合泛化能力的能力，在结构泛化任务中，基于序列的模型表现接近零，而组成模型在结构泛化任务中表现接近完美，这表明结构泛化是组成泛化的关键度量，需要能够处理复杂结构的模型。

Feb, 2022

学习推理中长度泛化的理论

针对学习推理中的长度泛化问题，本文通过理论研究提出一种可以模拟成有向无环图（DAGs）的问题的长度泛化条件，并设计了基于该理论的问题表示方法，使用 Transformer 模型完美解决了诸如奇偶性、加法和乘法等具有挑战性的推理问题。

Mar, 2024