May, 2021

HerBERT:基于 Transformer 的波兰语预训练语言模型的高效实现

TL;DR本文介绍了第一项针对波兰语的去构建 BERT 的训练过程的消融研究,其中探讨了跨语言训练和其他因素,最终实现了一个波兰语 BERT 模型 HerBERT,并在多个下游任务中达到了最佳结果。