LSTMs 自下而上地组合（和学习）

EMNLPOct, 2020

LSTMs Compose (and Learn) Bottom-Up

Naomi Saphra, Adam Lopez

TL;DR本研究利用基于门控交互的 LSTM 拆分相依度 DI 度量，探索 LSTM 构成性行为的序列表现层次结构，发现 DI 与语法距离有关；为探索这些构成性表现在训练过程中的归纳偏差，进行了简单的合成数据实验，支持一种关于如何自底向上学习层次结构的假设。

Abstract

Recent work in NLP shows that lstm language models capture hierarchical structure in language data. In contrast to existing work, we consider the \textit{learning} process that leads to their compositional behavior. For a closer look at how an LSTM's sequential representations are comp

lstm language models hierarchical structure decompositional interdependence syntax inductive biases

发现论文，激发创造

基于 LSTM 的依存句法递归子树组成

研究神经依赖解析中树形结构模型需要在序列模型之上添加的必要性，通过双向 LSTM 提取的特性进行了模型基础，证明前向 LSTM 和组合提取相似信息并且组合提取更适用于基于转移的解析器。

Feb, 2019

从基础开始建立表示？语言模型中局部组合的实证研究

本文探讨了现代语言模型是否能够学会表示复合短语中的复合性和非复合性，通过预测长语的内部表示来证明了现代语言模型可以预测一个父短语的表示。同时，通过多种分析，揭示了不同类型的语言模型何时产生了复合表示，并探讨了未来建模工作的可能性。

Oct, 2022

神经网络中的树状结构组成，无需树状结构架构

本论文通过对人工数据任务的实验，研究了基于树结构和基于序列的神经网络模型对于递归组合结构的应用效果。结果表明，基于序列的 LSTM 模型同样能够识别该结构并进行相应运用，但树结构模型在处理这种结构时表现更为出色。

Jun, 2015

语言建模的组合方法

本文提出了一种新的语言模型，通过序列组合树来取代之前基于线性链的假设，消除了结构上的任何假设，利用对比熵作为评估度量标准对新模型进行评估，相较于以往基于递归神经网络的模型，在失真级别上获得了超过 100% 的改进。

Apr, 2016

神经语言模型中的分层表示：期望的抑制和恢复

本研究旨在探究神经语言模型是否能够在单线性序列输入的情况下提取层次信息，并通过中心嵌套句子和语法岛约束等自然语言现象的实验研究证明：LSTM 能够识别和利用堆栈数据结构来存储和获取一定数量的语言层次结构。

Jun, 2019

具有瓶颈的递归神经网络诊断（非）合成性

本研究使用递归神经网络模型和限制信息传递的瓶颈机制，通过比较有无瓶颈情况下模型对数据的表示，提出了一种衡量复合性的度量标准，并基于此标准实现了一个数据集的复合性排序，应用于算术表达式合成数据和情感分类自然语言数据。

Jan, 2023

迭代分解：通过监督推理过程提高科学问答

通过使用透明的中间状态进行复合会带来可解释性和安全性的好处，但可能需要工作流程支持和基础设施来保持竞争力，为此我们描述了一种人在循环中使用的对于开发和完善复合 LM 程序的工作流程，并开发了一个可视化 LM 程序执行跟踪的开源工具 - ICE，通过三个真实世界的案例将这一工作流程应用于 LM 程序，并比非组合基线提高了 LM 程序的准确性 - 描述随机对照试验中使用的安慰剂（25％到 65％），评估参与者遵守医疗干预（53％到 70％）以及在 Qasper 数据集上回答 NLP 问题（38％到 69％）。

Jan, 2023

从 Frege 到 chatGPT：语言、认知和深度神经网络中的组合性

人工智能中的大型语言模型和深度神经网络通过学习组合性处理和元学习的方式，展示了复杂的认知行为，为人类认知研究提供了新的视角和可能性。

May, 2024

在 NLP 中可视化和理解神经模型

在这篇论文中，我们描述了四种策略，用于可视化 NLP 神经模型中的组合性。我们介绍了三种简单的方法以可视化单元对最终合成表示的影响，并在情感分析方面测试了这些方法，发现 LSTMs 的表现优于简单的递归神经网络。

Jun, 2015

分析 NLI 模型的组合敏感性

本研究通过实验验证，发现多个最先进的 NLI 模型都过度依赖词汇而无法使用组合语义，因此提出了一种可分析自然语言例句中 NLI 模型组成特性的测试设置，并在已有数据集上测试，这种测试设置可以帮助模型更好地了解复杂的含义，并为模型的改进提供机会。

Nov, 2018