Aug, 2024

Dr.学院:评估大型语言模型在教育中提问能力的基准

TL;DR该研究解决了大型语言模型(LLMs)在教学能力,特别是提问能力方面的缺乏评价。通过建立基准并利用安德森与克拉斯沃尔分类法,研究探索了LLMs生成教育问题的能力。结果表明,GPT-4在一般、文科和科学课程教学中表现出显著潜力,而Claude2更适合作为跨学科教师。