May, 2024

Aya 23: 开放权重发布以促进多语言进展

TL;DRAya 23是一种多语言语言模型,在扩展接近全球人口一半的23种语言的同时,通过将更多容量分配给预训练阶段包含的少量语言,Aya 23在其涵盖的语言上表现较好,超过了Aya 101等大规模多语言模型以及Gemma、Mistral和Mixtral等广泛使用的模型,在广泛的区别性和生成性任务上有着出色的表现。