Oct, 2021

或许 PTLM 应该上学——用于评估开放式书籍和封闭式书籍的问答任务

TL;DR本文目的是提出一种以大学入门教材为基础的问题回答任务,以测评预训练语言模型的理解能力,并通过社会科学和人文领域的两个大学入门教材展示预训练语言模型在 0-shot 设置下的表现。