May, 2023

预训练语言模型中知识获取和利用差距的测量

TL;DR本研究采用系统化的框架来衡量预训练语言模型中参数化知识的利用情况,以事实知识衡量了 12.5M 到 13B 参数的模型,并观察到它们在获取与利用知识方面存在差距和一定程度的鲁棒性问题,而更大的模型可以减少获取知识的差距,但利用知识的差距仍然存在。