Rainier：基于强化学习的常识问答知识感知器

EMNLPOct, 2022

Rainier：基于强化学习的常识问答知识感知器

Rainier: Reinforced Knowledge Introspector for Commonsense Question Answering

Jiacheng Liu, Skyler Hallinan, Ximing Lu, Pengfei He, Sean Welleck...

TL;DR本文提出了 Rainier 方法，该方法学习在回答给定问题时生成相关上下文知识，经过增强学习后显示出实质和一致的性能增益，超过了 GPT-3 引出的常识知识的质量，并在 9 个不同的常识基准测试中获得了一致的表现提高。

Abstract

Knowledge underpins reasoning. Recent research demonstrates that when relevant knowledge is provided as additional context to commonsense question answering (QA), it can substantially enhance the performance even on top of state-of-the-art. The fundamental challenge is where and how to find such knowledge that is high quality and on point with respect to the

commonsense question answering rainier knowledge generation reinforcement learning contextual relevance

发现论文，激发创造

生成式知识促进常识推理

通过从语言模型中产生知识并将其作为额外输入用于回答问题，我们开发了一种生成知识提示方法，它不需要针对知识集成的任务特定监督，也不需要访问结构化的知识库，并在四个常识推理任务中提高了大规模、最先进模型的性能。这凸显了大规模语言模型作为提高常识推理的外部知识的灵活来源。

Oct, 2021

如何通过额外知识来提升自然语言常识问答能力？

本文提出了将外部常识知识与语言模型相结合的方法，以提高多选题目中常识知识的应用。研究人员采用三种不同的知识插入策略和四种不同的问题 - 回答模型，分析预测结果并探索进一步改进的范围。

Sep, 2019

通向可推广的神经符号共识问题回答系统

本文针对非萃取式常识问答（QA）这一具有挑战性的 AI 任务进行了探讨，对最近的常识 QA 方法、流行的知识资源和知识融合方法进行了系统分析，并研究了多个常识数据集上的基准测试。结果表明，注重知识融合的注意力注入方式似乎是一种较好的选择，并且知识库与数据集之间的领域重叠度对于确定模型的成功程度具有至关重要的作用。

Oct, 2019

晶体：强化自反馈的反观型推理者

提出了一种新的内省型常识推理模型 Crystal，通过强化学习来调整模型的知识内省和基于知识的推理模式，使模型的性能和透明度明显提高。

Oct, 2023

R$^3$: 强化学习阅读器 - 排名器用于开放领域问答

本文提出了一种基于神经网络和增强学习的新型开放领域问答系统，通过信息检索结合阅读理解模型对大规模语料库进行查询，显著提高了多个数据集的表现。

Aug, 2017

FusionMind -- 提升问题与回答的外部上下文融合

利用预训练语言模型（LMs）和知识图谱（KGs）解答问题存在识别相关知识和进行联合推理的挑战。通过与先前发表的 QAGNN 方法进行比较，我们发现将相关的知识事实纳入问题上下文有助于提高问题回答性能，而将知识图谱融入语言模型中则只能带来少量增长，这表明将上下文知识事实结合起来可能对增强问题回答性能更具影响力。

Dec, 2023

将外部知识融入生成式阅读理解中的问答

本文提出了一种新的神经网络模型 KEAG，该模型利用外部知识解决 QA 问题，能够比现有的知识感知 QA 模型生成更高质量的答案，并证明其在利用知识方面的有效性。

Sep, 2019

对话问答模型的强化重述生成之稳健训练

通过我们提出的 REIGN 框架，我们通过多种步骤来解决面对表面形式变化的局限性学习环境，其中包括系统生成训练问题的改写，通过深度强化学习改善问答模型的性能，以及在一个基准测试集上训练模型并应用于另一个。我们通过大量多样的改写生成评测数据的方式对训练模型的鲁棒性进行了严格评估，结果显示，通过改写生成的训练方法的对话问答模型明显优于只使用金标准问答对进行标准训练的模型。

Oct, 2023

基于图形迭代检索多个知识源来提高常识问答

该研究提出了一种将多种知识源集成起来的问题回答方法，着重利用基于图的迭代知识检索模块和答案感知的注意机制，从多个知识源中检索和综合背景知识，并在 CommonsenseQA 数据集上实现了最优的表现。

Nov, 2020

利用潜在知识和对话上下文实现真实世界会话问答

该论文提出了一种基于神经检索 - 阅读 (Retrieval-Reading) 系统和基于 TFIDF 的文本摘要技术来利用先前的谈话历史中的潜在知识的方法，以便更好地回答问题，并且实验证明该系统显著提高了回答质量。

Dec, 2022