Apr, 2022

西班牙语句子表示的评估基准

TL;DR通过构建两个评估基准(Spanish SentEval 和 Spanish DiscoEval),我们评估了最近的预先训练的西班牙语语言模型的功能和局限性,这些基准包括大量现有的和新构建的数据集,以解决来自各种领域的不同任务,并发现在对话评估任务的情况下,多语言模型 mBERT 通常提供比仅用西班牙语文档进行训练的模型更丰富的潜在表示。我们希望我们的贡献将激发一种更公正,更可比以及更不繁琐的方式来评估未来的西班牙语语言模型。