BriefGPT.xyz
Ask
alpha
关键词
autograding
搜索结果 - 2
基于 LLM 的短文本答案自动评分方法探究
通过评估大型语言模型在自动评分方面的可行性,并强调大型语言模型如何支持教育工作者验证评分程序,研究表明,虽然 “开箱即用” 的大型语言模型提供了宝贵的工具来提供补充视角,但它们对于独立自动评分的准备工作仍然是一个尚未完成的工作,需要人工监督
→
PDF
10 months ago
短文、多语言、多类型答案的可信自动评分
本研究使用由 10 million 問題 - 答案組成的大型多語言數據集,展示了對 Transformer 模型的微調可以應用於複雜數據集的自動評分,並討論了評分的信任和倫理問題。透過人工介入自動評分的過程,我們展示了如何提高自動化評分答案
→
PDF
3 years ago
Prev
Next