评估大型语言模型在编程教育中生成反馈的应用

Mar, 2024

评估大型语言模型在编程教育中生成反馈的应用

Evaluating the Application of Large Language Models to Generate Feedback in Programming Education

Sven Jacobs, Steffen Jaschke

TL;DR该研究探讨了大型语言模型（特别是GPT-4）在提升编程教育方面的应用。该研究介绍了一个利用GPT-4设计的网页应用，用于对编程任务提供反馈，但不提供解决方案。该网页应用在一个学期内进行了51名学生的评估，结果显示GPT-4生成的大部分反馈有效地解决了代码错误。然而，不正确的建议和虚构的问题导致进一步改进的需求。

Abstract

This study investigates the application of large language models, specifically gpt-4, to enhance programming education. The research outli