Jul, 2024

模型不确定性能否作为多项选择题难度的代理?

TL;DR通过利用生成型大模型的不确定性来研究与学生答题分布之间的两种不同不确定性度量指标的相关性,我们观察到某些目前存在但较弱的相关性,同时发现在正确与错误答案情况下模型的行为存在差异,并且相关性在不同的问题类型之间存在显著差异。