ACLMay, 2021

BERT 受到惊讶的方式?语言异常的逐层检测

TL;DR本篇论文通过在三种语言模型(BERT,RoBERTa 和 XLNet)的中间层使用高斯模型进行密度估计,评估了我们的方法。结果表明,语言模型使用不同的机制来检测不同类型的语言异常,语义异常和常识异常在 RoBERTa 模型上没有在任何中间层中表现出异常惊异。