May, 2024

深度强化学习下的自动评分模型审计

TL;DR探索使用深度强化学习来审计自动短答案评分(ASAG)模型,以揭示其质量不可靠的问题。通过培训一个强化学习代理来修改学生的回答,以获得自动评分模型的高分,并发现自动评分模型的潜在缺陷。