Apr, 2022

关于在持续预训练中有效地学习知识

TL;DR通过定义知识裸露和无知识 token 并对样本进行专业标注,该研究发现 PLMs 在从非结构化文本中获取知识方面存在困难并开发了两种解决方案来帮助模型进行更多的知识自学习,实验证明了这些方法的有效性,是第一次探索做到完全自我监督的知识连续预训练。