同行排名法用于同行评估

May, 2014

The PeerRank Method for Peer Assessment

Toby Walsh

TL;DR本文提出了基于 PeerRank 方法的同伴评估技术，该方法可以有效地对同伴打分进行加权，具有一定的形式属性和性能优势。

Abstract

We propose the peerrank method for peer assessment. This constructs a grade for an agent based on the grades proposed by the agents evaluating the agent. Since the grade of an agent is a measure of their ability

peerrank peer assessment grading method formal properties synthetic data

发现论文，激发创造

简单等级评分法有多有效？

这篇论文提出了一种基于同伴评分的计算大规模在线开放课程中学生学术表现可靠信息的简单可行方法，使用类排序聚合规则并考虑学生的评分行为提高评分的效度，通过对评分行为的理论框架和实验模拟的验证证明其具有高精度。

Feb, 2016

有序同行评分方法

研究了自动从等级同行反馈中推断学生成绩的问题，并探索了几种概率模型来评估学生成绩和评分人的可靠性。

Apr, 2014

贝叶斯推理改进同行评分

本文探讨了对等评分系统，提出了一种新的概率模型，该模型能够更准确地估计群体作业的分数，并且使用混合整数规划将计算结果更易解释。作者在多个大型班级进行了实验验证，结果表明，使用该模型可以更准确地估计真实的分数、学生提交低精度报告的可能性以及其固有的评分误差的变化。

Sep, 2022

聚合部分排名及其在大规模在线开放课程中同行评分中的应用

研究揭示排序同行评分可用作大规模在线开放课程 (MOOC) 的学生评估的高度有效和可扩展解决方案，通过使用一种 Borda-like 聚合方法，在分布过程中使用简单的方法分配任务，并且即使学生具有不完美的评分能力，该方法也非常稳健。

Nov, 2014

MOOCs 中同学互评的调优模型

本文提出算法来评估和纠正评分者偏见和可靠性，通过对 Coursera 的 HCI 课程提供的 63,199 个同行评分进行分析，实现了同行评分准确性的显著提高，同时将评分者偏见和可靠性与学生因素如学生参与度、表现以及评论风格相关联，并证明了我们的模型可以实现更智能的评分分配。

Jul, 2013

考分重要时的排序学习

本文通过研究采用分级标签的学习排序问题，提出了一种多目标结构，能够在优化排序性能和等级预测性能方面取得比其他方法更好的结果，证明了利用序数级别信息的好处。

Jun, 2023

Catch Me if I Can: Peer Assessment 中策略行为的检测

本研究考虑同行评估任务中的策略行为，设计了一种测试方法以侦测此类行为，并通过实验验证了其检测能力。

Oct, 2020

PRD：同行评等与讨论提升基于大型语言模型的评估

研究论文通过引入基于教育领域的 insights 和 lessons，提出了改进大型语言模型评估的新方法，包括利用同行排序算法和同行讨论来提高评估的准确性和与人类判断的一致性，并为探索难以比较的模型提供了空间。

Jul, 2023

同儕提名：放寬精確度以提高同儕選擇的準確性

该论文介绍了一种新的算法 - PeerNomination，用于提高同行评议的公正性，避免个体代理的干扰，适用于资源分配、机制设计等领域，并在多个度量标准下在实证研究中取得更高的准确性。

Apr, 2020

投票与排序：基于社会选择理论的基准评估修订

该论文提出了 Vote'n'Rank 框架用于在多任务基准测试中排名系统，并通过该方法在不同领域中比较多个系统的表现，从而得出结论和新的 insights。

Oct, 2022