May, 2023

利用单次提示和文本相似性评分模型进行简答评分

TL;DR本文研究了一种自动短答案评分(ASAG)模型,提供了分析性得分和最终的整体得分。使用基于大型语言模型(LLM)的一次提示和文本相似性评分模型,通过小型手动注释数据集进行领域适应性,获得了较高的准确性和加权 kappa 值,从而在公开 ASAG 数据集的子集上取得了重大进展。