晶体：强化自反馈的反观型推理者

EMNLPOct, 2023

晶体：强化自反馈的反观型推理者

Crystal: Introspective Reasoners Reinforced with Self-Feedback

Jiacheng Liu, Ramakanth Pasunuru, Hannaneh Hajishirzi, Yejin Choi, Asli Celikyilmaz

TL;DR提出了一种新的内省型常识推理模型 Crystal，通过强化学习来调整模型的知识内省和基于知识的推理模式，使模型的性能和透明度明显提高。

Abstract

Extensive work has shown that the performance and interpretability of commonsense reasoning can be improved via knowledge-augmented reasoning methods, where the knowledge that underpins the reasoning process is e

commonsense reasoning knowledge-augmented reasoning introspective commonsense reasoner knowledge introspection knowledge-grounded reasoning

发现论文，激发创造

Rainier：基于强化学习的常识问答知识感知器

本文提出了 Rainier 方法，该方法学习在回答给定问题时生成相关上下文知识，经过增强学习后显示出实质和一致的性能增益，超过了 GPT-3 引出的常识知识的质量，并在 9 个不同的常识基准测试中获得了一致的表现提高。

Oct, 2022

带关系预测器的神经符号常识推理器

本篇论文提出了一种神经符号推理器，可以处理大规模的动态常识知识图谱，通过学习逻辑规则，提供可解释性的预测，并在 CKGs 的链接预测任务上表现优于现有的技术。

May, 2021

利用显式推理进行常识增强式对话模型中的推理整合

通过将常识推理分解为明确步骤，从而更好地生成、选择和整合常识来提高对话交互的自然性、参与度、特定性和整体质量，从而在常识推理增强的响应生成领域取得了最新技术进展。

Jun, 2024

通过知识蒸馏进行的隐含推理链条

使用语言模型的内部隐藏状态进行隐式推理，通过垂直在不同层的隐藏状态中进行推理来解决以前无法解决的任务，而无需进行明确的思维链条推理。

Nov, 2023

多头知识关注的社交常识推理

本文提出了一种新颖的多头知识注意模型，该模型对半结构化的常识推理规则进行编码，并学习将它们纳入基于 Transformer 的推理单元中。在推理任务中，我们评估了模型在需要不同推理技能的两个任务上的表现，即推断性自然语言推理和反事实不变性预测，并展示了我们提出的模型相对于强大的最先进模型（例如 RoBERTa）在两个推理任务中的表现提高，通过扰动知识，并对模型的知识纳入能力进行定性分析，我们验证了模型推理能力的稳健性。值得注意的是，我们在最佳解释方面展示了学习执行反事实推理的模型对推断性推理任务的帮助，这在我们所知道的情况下是首次演示的。

Oct, 2020

在视觉对话中运用多结构常识知识进行推理

本文提出了一种基于多结构的常识知识的推理模型，通过句子级事实和图级事实表示外部知识，通过图形交互和变压器融合捕获相关的知识并将其融入视觉和语义特征中，已在 VisDial v1.0 和 VisDialCK 数据集上取得了有效的性能优于比较方法。

Apr, 2022

基于神经常识知识和符号逻辑规则的多跳对话推理

本文提出了一种用于对话代理的零样本通识推理系统，可以通过基于转换器的生成通识知识库找到用户命令中未明示的假设，同时提出了一种动态问题生成策略来从人类用户中提取缺失的知识，实验表明，相比现有技术，成功率提高了 35%。

Sep, 2021

生成式知识促进常识推理

通过从语言模型中产生知识并将其作为额外输入用于回答问题，我们开发了一种生成知识提示方法，它不需要针对知识集成的任务特定监督，也不需要访问结构化的知识库，并在四个常识推理任务中提高了大规模、最先进模型的性能。这凸显了大规模语言模型作为提高常识推理的外部知识的灵活来源。

Oct, 2021

KagNet: 基于知识的图网络用于常识推理

该研究提出了一种基于知识图谱的语义推理框架，以解决常识性问题，并通过引入 KagNet 模型和 ConceptNet 外部资源，取得了在常识 QA 数据集上的最佳表现。

Sep, 2019

检索增强通识推理：一种统一方法

本文提出了一种统一的基于检索增强的通识推理框架（RACo），包括一个新构建的包含 2000 万个文档的通识语料库和训练通识检索器的新策略。对四个不同的通识推理任务进行的广泛评估结果表明，我们提出的 RACo 可以显著优于其他知识增强方法的竞争者，在 CommonGen 和 CREAK 排行榜上取得了新的 SoTA 性能。

Oct, 2022