May, 2022

知识图谱通识自监督的实证研究

TL;DR本文旨在研究知识抽取技术对于不同规模和架构的语言模型训练的影响以及如何在各种下游 NLP 任务中进行有效的迁移学习。研究发现,在预训练中选取适当的知识可以显著提高语言模型的泛化性能,数据量越大效果越好,而平衡不同方面的抽样策略可以提高编码解码模型的性能。