Apr, 2022

RobBERTje: 一个被蒸馏的荷兰 BERT 模型

TL;DR该论文讨论预训练模型以及使用语言模型精简方法创建的 RobBERTje 蒸馏模型,发现在包含长序列的任务上,与其教师模型相比,蒸馏模型具有更少的性别刻板印象和更好的训练和性能效果。