ACLMay, 2022

当一个句子不引入语篇实体时,基于 Transformer 的模型有时仍然会引用它

TL;DR本文研究了语言模型在理解文本中的不定式短语和否定语气等句法结构时的实际能力,发现目前即使是规模达到 GPT-3 的模型,也并未完全掌握基本的实体追踪能力。