EMNLPOct, 2022

Rainier:基于强化学习的常识问答知识感知器

TL;DR本文提出了 Rainier 方法,该方法学习在回答给定问题时生成相关上下文知识,经过增强学习后显示出实质和一致的性能增益,超过了 GPT-3 引出的常识知识的质量,并在 9 个不同的常识基准测试中获得了一致的表现提高。