Feb, 2024

塞尔维亚语的新语言模型

TL;DR本文简要介绍了用于塞尔维亚语的基于 Transformer 的语言模型的发展历史,同时还提出了几个使用塞尔维亚语资源进行训练的文本生成和矢量化模型。在四个自然语言处理任务上比较了十个选择的塞尔维亚语矢量化模型,包括两个新的模型。本文分析了在每个选定任务上哪些模型是最好的,它们的大小和训练集大小如何影响这些任务的性能,并确定了为塞尔维亚语训练最佳语言模型的最优设置。