May, 2024

使用大型语言模型生成程序练习的现状调查研究

TL;DR通过调查研究,本文分析了大语言模型(LLMs)在编程练习生成能力方面的状况,并提出了一个评估矩阵,帮助研究人员和教育工作者决定哪个 LLM 适合编程练习生成用例。此外,本文还发现多个 LLM 能够生成有用的编程练习,但存在着 LLMs 能够解决由 LLMs 生成的练习的难题。该论文对 LLMs 在教育中的整合进行了有益的讨论。