Jul, 2024

评估生成和判断编程反馈的语言模型

TL;DR使用开源的大型语言模型在学习编程中评估编程作业反馈的高质量和评判编程反馈的质量方面,与专有的模型相比,取得了很好的效果。