Sep, 2022

为何神经语言模型在处理问题回答的语义变化时仍需要常识知识?

TL;DR本文通过使用诊断测试,揭示了预训练 MNLM 中包含的常识知识,并发现 MNLM 模型不能准确理解语义关系,还存在对需要常识知识的语义变化的脆弱性。此外,我们发现了某些知识未被训练的根本原因,并通过在受控实验中利用外部常识知识库来丰富文本的方法,提出了克服 MNLM 模型的局限性的可能性。