EMNLPMay, 2020

鸟有四条腿?!NumerSense:探究预训练语言模型的数值常识知识

TL;DR本文旨在探讨预训练语言模型(PTLMs)是否具备数值常识知识,并介绍了一个诊断数据集 NumerSense 用于评估 PTLMs 的性能,结果表明:(1)BERT 和 RoBERTa 表现不佳(2)通过有监督学习可以有所提升(3)最佳的监督模型仍然表现不及人类表现。