Feb, 2024

阿拉伯语MMLU: 评估阿拉伯语的大规模多任务语言理解

TL;DR评估语言模型、阿拉伯语多任务语言理解基准、模型性能