Mar, 2024

一种基于 LLMs 的思维链提示方法用于评估学生科学形成性评价回答

TL;DR本研究探讨了使用大型语言模型(LLMs)对 K-12 科学问答进行评分和解释的方法。通过结合少样本学习、主动学习和推理链条,采用 GPT-4 自动评分中学地球科学问答,我们成功地对作业答案进行评分并提供了有意义的解释,进一步系统分析了该方法的优缺点,揭示了人与机联合评分技术提升开放式科学评估的潜力。