May, 2024

UCCIX: 爱尔兰卓越大型语言模型

TL;DR该研究通过提出一种新的框架,使用极少量的文本数据来进行大规模语言模型的训练,开发了 UCCIX,一个面向爱尔兰语的开源语言模型,并在爱尔兰语任务中取得了高达 12% 的性能提升,提供了爱尔兰语数据集以便进行评估和未来研究,旨在推动爱尔兰语在数字时代的发展和其它土著语言的应用。