May, 2023

利用人类反馈扩大教育数据集规模:结合众包工人和比较判断

TL;DR利用非专业众包工作者进行复杂的学生数据评估的实验表明,使用比较判断可显着提高两项任务的评定间判定一致性。这一结果符合教育评价领域的比较判断优势的已有文献,也符合人工智能研究中的趋势,即在处理非专业众包工作者的模型输出时,比较判断成为提供人类反馈的首选方法。然而,据我们所知,这些结果是在证明使用比较判断和众包工作者评估教育数据的组合效果方面的新颖且重要的成果。