EMNLPOct, 2020
预训练变压器中微调和句子级探测在语言知识中的相互作用
On the Interplay Between Fine-tuning and Sentence-level Probing for Linguistic Knowledge in Pre-trained Transformers
Marius Mosbach, Anna Khokhlova, Michael A. Hedderich, Dietrich Klakow
TL;DR本文研究了 BERT、RoBERTa、ALBERT 三个预训练模型在句子级探测下,微调如何影响它们的表示。发现微调对于探测任务的准确性有着重大影响,但不同模型和任务的影响有所不同。在发现微调对于探测有着积极或消极的影响时,需进行慎重解释。