Jun, 2024

IrokoBench:大型语言模型时代的非洲语言新基准

TL;DR本研究使用 IrokoBench 数据集对低资源的非洲语言进行了零样本学习、少样本学习和翻译测试,并发现了高资源语言和低资源非洲语言之间的显著性能差距。机器翻译测试集从而改善了一些以英语为中心的大型模型的表现,结果表明需要更多的努力来开发和适应非洲语言的大型语言模型。