EMNLPApr, 2021

探究时间跨度:RoBERTa 知道什么以及何时知道?

TL;DR探究语言模型中不同知识类型在 (pre) training 时学习的时间,发现语言知识快速、稳定、跨领域学习;事实和常识知识较慢、受领域限制;而推理能力一般不稳定从而建议研究人员使用更有效的方法加快必要知识的学习。