Feb, 2022

从 FreEM 到 D'AlemBERT: 一份大语料库和语言模型用于早期现代法语

TL;DR本文介绍了为早期现代法语(16 至 18 世纪)开发 NLP 工具的努力,包括创建针对该语言的 FreEM_max 语料库以及基于 RoBERTa 的语言模型 D'AlemBERT 的训练和测试,发现该模型具有传递学习的能力,在较少资源的时间段表现也得到提升,同时公开了 D'AlemBERT 和 FreEM_max 语料库的子部分。