实体抽象能帮助生成变换器进行推理吗？

Jan, 2022

实体抽象能帮助生成变换器进行推理吗？

Does Entity Abstraction Help Generative Transformers Reason?

Nicolas Gontier, Siva Reddy, Christopher Pal

TL;DR研究使用实体类型抽象在预训练的转换器中的效用，并在四个需要不同形式逻辑推理的自然语言处理任务上测试这些方法：(1) 基于文本关系推理的组合语言理解 (CLUTRR)，(2) 异化推理 (ProofWriter)，(3) 多跳问题回答 (HotpotQA) 和 (4) 对话问题回答 (CoQA)。我们提出并实证探讨了三种添加这种抽象的方法：(i) 作为额外的输入嵌入，(ii) 作为单独的序列来编码，(iii) 作为模型的辅助预测任务。总的来说，我们的分析表明，具有实体抽象知识的模型比没有它的模型表现得更好。最佳的抽象感知模型在 CLUTRR 和 ProofWriter 上实现了 88.8% 和 91.8% 的总体准确性，而基线模型分别实现了 62.9% 和 89.8%。然而，对于 HotpotQA 和 CoQA，我们发现 F1 得分平均只提高了 0.5%。我们的结果表明，显式抽象的好处在形式上定义了需要多种推理跳数的逻辑推理设置中是显著的，但指向了这种抽象在较少准确逻辑结构的 NLP 任务中益处较小的概念。

Abstract

We study the utility of incorporating entity type abstractions into pre-trained transformers and test these methods on four nlp tasks requ

pre-trained transformers entity type abstractions nlp tasks logical reasoning compositional language understanding

发现论文，激发创造

走向知识驱动的自然语言理解与生成

通过将转换器模型与知识表示相关联，本论文研究了自然语言理解和生成的效果，并回答了以下关键研究问题：(i) 实体知识是否能够超越实体链接等实体为中心的任务，并带来更多的好处？(ii) 如何从原始文本中准确有效地提取这种结构化知识，尤其是嘈杂的网络文本？(iii) 除了结构化知识，其他类型的知识如何对改进自然语言处理任务有所贡献？研究表明，引入相关和最新的实体知识有助于虚假新闻检测，而面向实体的语言转换显著提高了零样本跨语言迁移的效果。在提取结构化知识方面，将负面样本整合和与实体规划一起训练显著提高了性能。此外，研究还发现，其他一般形式的知识，如参数化知识和精炼知识，有助于多模态和多语言知识密集型任务。这项研究展示了多元知识整合的实际好处，并鼓励在这个方向上进一步探索。

Mar, 2024

语言模型对推理的人类内容效应展示

大型语言模型在抽象推理任务上表现优秀，但与人类推理问题存在相似的缺陷，同时受到人类知识和信仰的影响，使用可信的现实情境方案进行推理可以提高推理质量，这种关联性帮助我们了解认知效应和语言模型表现的因素。

Jul, 2022

利用关系抽象进行推理的学习

本文介绍了一种利用关系抽象概念来帮助大型语言模型在数学推理方面提高的新方法，并发现将这种序列用作提示可使模型具有更强的推理能力，特别是在需要执行多步任务的情况下。

Oct, 2022

自监督变形器中抽象表征的形成与功能

通过研究小规模 transformer 在重建部分遮蔽的简单蓝图可视场景方面的内在机制，我们发现网络发展了一种包含数据集的所有语义特征的中间抽象表示或抽象，这些抽象表现为低维流形，其中语义相关令牌的嵌入短暂地收敛，从而实现了对下游计算的泛化。我们还引入了一种语言增强架构（LEA），旨在鼓励网络表达其计算过程，发现 LEA 发展了一种易于解释的以抽象为中心的语言，使我们更容易访问和指导网络的决策过程。

Dec, 2023

面向任务的对话系统的逻辑推理

本篇论文提出了一种基于预训练的 Transformer 模型 fine-tune 的方法，使之具备在对话语境中进行逻辑推理和回答问题的能力，而无需额外的训练数据集。研究结果表明，该模型在已训练属性上能够达到 90% 以上的精度，在适当的对话语境下能够提取出适当的限制条件传递给下游组件 (e.g. 知识库)。

Feb, 2022

变形金刚何时能够通过抽象符号进行推理？

调查了 Transformer 大型语言模型在涉及抽象符号的关系推理任务中的能力。对于 (i) 回归任务，我们证明了 Transformer 在训练时具有泛化性，但需要大量的训练数据；对于具有符号标签的 (ii) 下一个令牌预测任务，我们展示了一种 “反比例尺律”：随着嵌入维度的增加，Transformer 无法泛化。针对 (i) 和 (ii) 这两种情况，我们提出了微妙的 Transformer 修改，通过每个头部添加两个可训练参数来减少所需的数据量。

Oct, 2023

基于 Transformer 的描述逻辑上下文推理

通过使用描述逻辑知识库构建一个合成的自然语言问答数据集，本研究评估了基于 transformer 的模型在推理能力、合成语境和知识库相关的问题上的表现，并展示了模型在训练过程中对不同推理深度的泛化能力。

Nov, 2023

多跳问答中底层推理任务有效性分析

通过分析采用底层推理任务（包括句子级和实体级）对三个方面的影响（1. 问答性能，2. 推理捷径， 3. 鲁棒性），我们建立了一个多任务模型来执行三个任务：句子级支撑事实预测，实体级推理预测和答案预测，实验结果表明底层推理任务可以提高问题回答的性能和防止推理捷径，但是却不能提高对小问题和反问题等对抗性问题的鲁棒性。

Feb, 2023

语言模型中的概念和公正推理

我们提出了一个新的概念化框架，迫使模型在抽象问题上进行概念推理并在可验证的符号空间中生成解决方案，使用这个框架作为分析工具，我们发现现有的大型语言模型在概念推理方面存在不足，并通过引入可信的归纳信号来改善模型的概念推理性能，实验证明我们提出的技术使模型的概念推理性能提高了 8% 至 11%，实现了一个更强大的推理系统，更少地依赖归纳偏见。

Mar, 2024

Transformer 能否在自然语言的片段中进行推理？

本文对深度学习在自然语言处理（NLP）方面的最新应用进行了调查研究，发现 transformer-based language models 在检测受控自然语言片段的有效推理方面表现出明显的过拟合问题，未能获取主导推理的逻辑原则。

Nov, 2022