Oct, 2023

LLMs 能评分短答阅读理解题:适用于低收入国家的基础识字能力评估

TL;DR利用生成型大型语言模型(即 GPT-4)有望可靠地评估短答阅读理解问题,并通过使用新的数据集和自动评分过程提供了改进基础扫盲教育的可能性。