Apr, 2023

领域特定的语言模型持续预训练用于捕捉心理健康领域长篇文本

TL;DR本文针对心理健康领域的 Reddit 帖子的长序列建模问题,进行了领域特定的持续预训练,基于 XLNet 和 Longformer 训练了 MentalXLNet 和 MentalLongformer 模型,评估了这两个模型的心理健康分类性能和长距离能力,并在 HuggingFace 上发布了这两个模型。