通过自我监督课程学习增强嵌套布尔逻辑

EMNLPOct, 2023

通过自我监督课程学习增强嵌套布尔逻辑

Empower Nested Boolean Logic via Self-Supervised Curriculum Learning

Hongqiu Wu, Linfeng Liu, Hai Zhao, Min Zhang

TL;DR语言模型的认知能力强大，本研究探讨了其推理能力是源于强大的泛化能力还是仅仅是与相关数据的接触。研究发现，任何预训练的语言模型，包括大型语言模型，在面对多层布尔逻辑时只能表现为随机选择器。为了赋予语言模型这种根本能力，本文提出了一种新的自监督学习方法 “课程逻辑推理（CLR）”，通过逐步在训练数据中增加嵌套的布尔逻辑链，并逐渐训练模型从简单的逻辑模式到更难的模式。这种新的训练范式使得语言模型能够有效地泛化到更难且更复杂的逻辑，这是通过简单的训练难以学习到的。此外，研究还表明，布尔逻辑是提高后续通用逻辑任务的良好基础。

Abstract

Beyond the great cognitive powers showcased by language models, it is crucial to scrutinize whether their reasoning capabilities stem from strong generalization or merely exposure to relevant data. As opposed to

cognitive powers language models boolean logic self-supervised learning curriculum logical reasoning

发现论文，激发创造

LogicLLM: 探索基于自监督逻辑增强训练的大型语言模型

本篇论文主要介绍了如何通过自监督后训练和上下文学习来增加逻辑知识，从而提高语言模型的逻辑推理能力，取得了比现有基线更好的效果。

May, 2023

大型语言模型逻辑推理的教学学习

通过对大型语言模型的研究，我们发现它们在逻辑推理方面存在缺陷，导致其在任务解决中产生反事实的答案。为了解决这个问题，我们提出了多种策略，赋予大型语言模型逻辑推理能力，从而使其能够在不同场景中生成更符合逻辑的答案。我们还通过构建一个综合数据集 (LMM-LR) 对该方法进行了评估和预训练。在不同任务上进行了广泛的定量和定性分析，验证了通过逻辑训练大型语言模型的有效性和必要性，并为将来的工作提供了启示。

Oct, 2023

LogiGLUE: 逻辑推理能力的语言模型分析调查和基准评测

通过对最新进展的简要回顾，本文试图了解大型语言模型在逻辑推理方面的能力，包括逻辑推理数据集、任务以及利用大型语言模型进行推理的方法。通过构建基准测试集 LogiGLUE，并训练一个经过指令微调的语言模型 LogiT5，研究了单任务训练、多任务训练以及思维链知识蒸馏微调技术在不同逻辑推理类别上的表现，旨在揭示大型语言模型在逻辑推理中的能力和潜在路径，为该关键领域的高级和精细化发展铺平道路。

Oct, 2023

民主化推理能力：从大型语言模型的个性化学习

通过多轮互动学习范式和自我反思学习，我们提出了一种定制化学习方法，从而将推理能力传授给较小的语言模型，以促进推理能力的开放和普及。

Oct, 2023

通过逻辑感知的课程调优改进知识图谱上的复杂推理

在本文中，我们提出了一个基于大型语言模型（LLMs）的知识图谱上的复杂逻辑推理模式，包括一个基于课程的逻辑感知调优框架，名为 LACT。通过二叉树分解来增强 LLMs 的推理能力，并设计了一个简单而灵活的逻辑感知课程学习框架，以解决不同类型复杂查询之间的困难差距。实验结果表明，LACT 显著改进了其他先进方法（平均提高了 5.5% 的 MRR 得分），达到了最新的最佳效果。我们的代码和模型将很快在 GitHub 和 huggingface 上发布。

May, 2024

大规模语言模型对于超领域逻辑推理任务的系统评估

大型语言模型在逻辑推理任务中的泛化性和鲁棒性评估及改善的研究。

Oct, 2023

语言模型可作为逻辑求解器

LoGiPT 是一种新颖的语言模型，通过直接模拟逻辑求解器的推理过程并严格遵守求解器的语法规则，绕过分析错误，并在竞争的语言模型上表现出优异的性能。

Nov, 2023

深入探究大型语言模型在逻辑推理中的自我验证能力

这篇论文研究了大型语言模型在逻辑推理中的自我验证能力，主要关注其准确识别逻辑谬误的能力。通过对包含 232 种谬误的数据集进行实验，发现现有的大型语言模型在准确识别谬误的过程中可能存在困难，并可能不能保证自我验证方法的有效性。论文提出了对未来研究和实际应用自我验证方法的建议。

Nov, 2023

DeepLogic: 基于端到端可微分的逻辑推理

探索如何使用基于 RNN 的迭代神经网络将符号逻辑定义为字符级逻辑程序，使其在高维向量空间中学习推理，进一步分析学习推理算法如何产生逻辑程序中的原子、文字和规则表示，并针对谓词和常量符号的长度以及多次跳跃推理的步数进行评估。

May, 2018

使用逻辑归纳偏置学习语言表示

本文介绍了一种基于逻辑推理的神经网络架构 FOLNet，它可以有效地学习强大的语言表示，并具有更强的迁移学习能力。实验证明，FOLNet 模型在多个语言理解任务中胜过了现有的强大的基于 Transformer 的方法。

Feb, 2023