Oct, 2020

低资源领域适应的多阶段预训练

TL;DR本文研究使用预训练语言模型的转移学习、领域特定术语扩展词汇表以及利用未标记数据结构创造辅助合成任务等方法,在IT领域的三个任务中,采用逐步应用的策略在预先训练的Roberta-large LM上显示出显着的性能提升。