EMNLPNov, 2022

AfroLM:一种基于自主学习的多语言预训练语言模型,适用于 23 种非洲语言

TL;DR本文提出了 AfroLM,这是一个利用自主主动学习(active learning)算法,仅仅用了比现有基准数据集小 14 倍的数据集从头开始预训练的跨 23 种非洲语言的多语言语言模型。与现有的大多数跨语言预训练模型相比,在各种 NLP 后续任务中,如命名实体识别、文本分类和情感分析等方面,AfroLM 取得了更好的优化和性能。