同行排名法用于同行评估
这篇论文提出了一种基于同伴评分的计算大规模在线开放课程中学生学术表现可靠信息的简单可行方法,使用类排序聚合规则并考虑学生的评分行为提高评分的效度,通过对评分行为的理论框架和实验模拟的验证证明其具有高精度。
Feb, 2016
本文探讨了对等评分系统,提出了一种新的概率模型,该模型能够更准确地估计群体作业的分数,并且使用混合整数规划将计算结果更易解释。作者在多个大型班级进行了实验验证,结果表明,使用该模型可以更准确地估计真实的分数、学生提交低精度报告的可能性以及其固有的评分误差的变化。
Sep, 2022
研究揭示排序同行评分可用作大规模在线开放课程 (MOOC) 的学生评估的高度有效和可扩展解决方案,通过使用一种 Borda-like 聚合方法,在分布过程中使用简单的方法分配任务,并且即使学生具有不完美的评分能力,该方法也非常稳健。
Nov, 2014
本文提出算法来评估和纠正评分者偏见和可靠性,通过对 Coursera 的 HCI 课程提供的 63,199 个同行评分进行分析,实现了同行评分准确性的显著提高,同时将评分者偏见和可靠性与学生因素如学生参与度、表现以及评论风格相关联,并证明了我们的模型可以实现更智能的评分分配。
Jul, 2013
本研究考虑同行评估任务中的策略行为,设计了一种测试方法以侦测此类行为,并通过实验验证了其检测能力。
Oct, 2020
研究论文通过引入基于教育领域的 insights 和 lessons,提出了改进大型语言模型评估的新方法,包括利用同行排序算法和同行讨论来提高评估的准确性和与人类判断的一致性,并为探索难以比较的模型提供了空间。
Jul, 2023
该论文介绍了一种新的算法 - PeerNomination,用于提高同行评议的公正性,避免个体代理的干扰,适用于资源分配、机制设计等领域,并在多个度量标准下在实证研究中取得更高的准确性。
Apr, 2020
该论文提出了 Vote'n'Rank 框架用于在多任务基准测试中排名系统,并通过该方法在不同领域中比较多个系统的表现,从而得出结论和新的 insights。
Oct, 2022