ACLApr, 2024

通过大型语言模型探索数学多项选择题的自动生成方式

TL;DR研究了基于大型语言模型的自动生成干扰项的任务,发现虽然大型语言模型能生成一些数学上有效的干扰项,但它们对于预测真实学生常见的错误或误解的能力较弱。