阿塞拜疆语开放基础模型

Jul, 2024

Open foundation models for Azerbaijani language

Jafar Isbarov, Kavsar Huseynova, Elvin Mammadov, Mammad Hajili

TL;DR本研究论文介绍了针对阿塞拜疆语的多语种大型语言模型的开源基础模型，包括大规模文本语料库、仅编码器语言模型的系列以及用于评估该模型的标注数据集，并对支持阿塞拜疆语的所有主要开源模型进行了广泛评估。

Abstract

The emergence of multilingual large language models has enabled the development of language understanding and generation systems in azerbaijani. However, most of the production-grade systems rely on cloud solutio