Jul, 2022

面向预训练语言模型的可解释性评估基准

TL;DR本文提出一种基于英文与中文标注数据的新型评估基准,旨在测试预训练语言模型在语法、语义、知识、推理和计算等多个方面的能力,并提供满足充分性和紧凑性的标注标记级别的理由,以及人性化的实例扰动,从而使用照常理性度量:诚实度的角度。实验结果表明,预训练语言模型在知识和计算方面表现非常糟糕;尤其是在理由较短的情况下,其所有维度上的可信度都远远不足够,并且在语法感知数据上评估的预训练语言模型不稳健。