ACLDec, 2021

使用 500 个任务评估预训练语言模型的适应能力

TL;DR本文采用新的基准 TaskBench500,从 500 个生成过程中的序列建模任务中,大规模地实证研究了 LM 适应性的特征和限制,发现 LM 在适应性上存在重要差异性和局限性,提出了 LM 适应性的三个方面。