Nov, 2022

CBEAF-Adapting: 增强型持续预训练用于构建中文生物医学语言模型

TL;DR本论文介绍了一种连续预训练方法,称为 CBEAF-Adapting,它的主要思想是在每个自注意力层和前馈网络中引入少量注意头和隐藏单元,有效地解决了领域适应中序列任务训练造成的遗忘问题,以中国生物医学领域为例进行了实验,结果表明我们的方法能够显著提高性能,并且减轻了遗忘问题。