一种可证明改进的众包算法，适用于难和易任务

Feb, 2023

一种可证明改进的众包算法，适用于难和易任务

A Provably Improved Algorithm for Crowdsourcing with Hard and Easy Tasks

Seo Taek Kong, Saptarshi Mandal, Dimitrios Katselis, R. Srikant

TL;DR本文提出了一种基于谱方法的标签聚类算法，从而在众包任务中提高 Dawid-Skene 模型推理个体正确标签的准确度。

Abstract

crowdsourcing is a popular method used to estimate ground-truth labels by collecting noisy labels from workers. In this work, we are motivated by

crowdsourcing ground-truth labels worker accuracy task types spectral method

发现论文，激发创造

光谱方法遇上 EM: 一种可证明优化的众包算法

本研究提出了一种用于多类众包标注问题的两阶段高效算法，第一阶段使用谱方法获取参数的初始估计，然后第二阶段通过 EM 算法优化 Dawid-Skene 估计器的目标函数来进一步细化估计，实验结果表明该算法具有最优收敛速率。

Jun, 2014

众包标注估计基础真相的极小最优收敛速率

本文证明了 Dawid-Skene 估计器的投影 EM 算法收敛速率的最优性，并通过一个比较研究与多数投票相比，展示了 Dawid-Skene 估计器的优势与局限性。

Oct, 2013

可靠众包系统的预算最优任务分配

本文考虑众包任务分配中的可靠性问题，提出了一种基于置信传播和低秩矩阵逼近的算法来决定如何分配任务，并从工人的答案中推断出正确答案。比较了不同算法的表现，发现基于者非自适应的算法是最优的。此外，还强调了建立可靠的工人信誉系统对于完全运用自适应设计的潜力至关重要。

Oct, 2011

基于成对共现的众包：可识别性和算法

本文提出了一个使用注释器响应的成对共现的框架，并展示了算法的实验结果，该算法在多种情况下优于现有算法。

Sep, 2019

基于置换的众包标注模型：最优估计与鲁棒性

本文提出一种排列模型 - 用于聚合和去噪众包标注数据，该模型是对经典的 Dawid-Skene 模型的重要推广，并介绍了一种新的误差度量方法，用于比较不同的估计器。我们设计了两种计算有效的估计器：WAN 估计器和 OBI-WAN 估计器，并对它们的性能进行了非渐近界限的界定。最后通过合成模拟和实验数据验证了理论结果。

Jun, 2016

通过自适应方案在众包中实现预算最优

该研究探讨了如何在固定预算下最大化标注数据的精确度，比较自适应任务分配与非自适应任务分配之间的优劣，并使用概率模型来解决这个问题。

Feb, 2016

从含有噪声的带有单标签数据中学习

提出一种新的算法来联合建模标签和工作者质量，从带有噪声的众包数据中学习，可优化有限的标注资源，解决如何从噪声工作者中学习以及如何分配标注预算来最大化分类器性能等问题。

Dec, 2017

标记众包中预算 - 保真度权衡的基本限制

通过信息论速率失真框架对人在循环计算问题进行建模和分析，以确定通过任何形式的查询和任何解码算法的结果和给定预算所能达到的最终保真度。此外，该论文还介绍并分析了一种查询方案，称为 $k$ -ary incidence coding，并研究了该场景下的查询定价。

Aug, 2016

众包场景下的动态任务分配

本文提出一种基于互信息解释的众包问题优化任务分配的方法，通过动态任务分配实现更高的准确度和可能需要更少的标签，从而提高了任务分配的效果。

Jan, 2017

带有约束条件的贝叶斯众包

本文探讨半监督众包分类在标签约束和实例约束两种情况下的贝叶斯算法，该算法基于变分推断，可以比无监督众包分类更有效地对人工注释信息进行聚合，该算法在多个众包数据集上的分析和实证验证了其表现的可量化提升。

Dec, 2020