EMNLPOct, 2023

印尼的大型语言模型只能通过小学考试:基于 IndoMMLU 的综合测试

TL;DR通过收集印尼的基础学校到大学入学考试的一系列考题,我们评估了大型语言模型是否能够通过这些考试,结果表明 GPT-3.5 仅能通过印尼的小学水平,并且对印尼的本地语言和文化了解有限,而诸如 BLOOMZ 和 Falcon 等较小的模型则无法通过这些考试。