Dec, 2023

使用 LLMs 自动评估学生代码理解

TL;DR利用 Large Language Models (LLMs) 和 encoder-based Semantic Textual Similarity (STS) 模型对编程领域学生解答的自动评估进行了比较,发现 LLMs 在少样本和思维链模式下与 fine-tuned encoder-based 模型的性能相当。