May, 2022
ORCA:通过定位预训练数据海洋中的支持数据证据解释提示型语言模型
ORCA: Interpreting Prompted Language Models via Locating Supporting Data Evidence in the Ocean of Pretraining Data
Xiaochuang Han, Yulia Tsvetkov
TL;DR本文旨在探究预训练模型在零样本情况下的特定任务认知。通过对支持数据证据进行迭代使用,可以发现 BERT 在情感分析和文本蕴含任务中对 BookCorpus 预训练数据的大量依赖,以及对掩盖任务动词词汇同义词的预训练示例的依赖。