Dec, 2019

BERT用于芬兰语的多语言处理

TL;DR本文主要介绍了采用预训练的深度学习语言模型用于自然语言处理的相关研究,特别是新型的transformer-based BERT模型。与其他大多采用英语等高资源语言的研究不同,本文侧重于针对冷门语言芬兰语的研究,探索基于多语言模型Fine-tune和基于芬兰语数据单独训练的模型的性能比较,实验结果表明后者的表现较好,成为当前芬兰语POS标注、NER和依存分析任务的先进模型。