ACLJun, 2023

口罩策略对语言模型知识记忆的影响

TL;DR本文的目标是建立对知识获取过程的更好理解。我们利用一系列预训练任务注入知识到模型中,并通过测量模型回答事实性问题的能力测试其知识保留能力。我们的实验表明,掩盖实体和基于逐点互信息的相关跨度的原则性掩盖方法可以更好地保留事实知识,而遮盖随机顺序的词标记会导致模型遗忘更多的事实知识。我们的发现表明,类似于执行任务的能力,通过训练执行其他任务时获取的(事实)知识也会被遗忘,该文提供了防止这种现象的方法。