众包标注估计基础真相的极小最优收敛速率

Oct, 2013

众包标注估计基础真相的极小最优收敛速率

Minimax Optimal Convergence Rates for Estimating Ground Truth from Crowdsourced Labels

Chao Gao, Dengyong Zhou

TL;DR本文证明了 Dawid-Skene 估计器的投影 EM 算法收敛速率的最优性，并通过一个比较研究与多数投票相比，展示了 Dawid-Skene 估计器的优势与局限性。

Abstract

crowdsourcing has become a primary means for label collection in many real-world machine learning applications. A classical method for inf

crowdsourcing machine learning label collection dawid-skene estimator convergence rates

发现论文，激发创造

光谱方法遇上 EM: 一种可证明优化的众包算法

本研究提出了一种用于多类众包标注问题的两阶段高效算法，第一阶段使用谱方法获取参数的初始估计，然后第二阶段通过 EM 算法优化 Dawid-Skene 估计器的目标函数来进一步细化估计，实验结果表明该算法具有最优收敛速率。

Jun, 2014

一种可证明改进的众包算法，适用于难和易任务

本文提出了一种基于谱方法的标签聚类算法，从而在众包任务中提高 Dawid-Skene 模型推理个体正确标签的准确度。

Feb, 2023

基于置换的众包标注模型：最优估计与鲁棒性

本文提出一种排列模型 - 用于聚合和去噪众包标注数据，该模型是对经典的 Dawid-Skene 模型的重要推广，并介绍了一种新的误差度量方法，用于比较不同的估计器。我们设计了两种计算有效的估计器：WAN 估计器和 OBI-WAN 估计器，并对它们的性能进行了非渐近界限的界定。最后通过合成模拟和实验数据验证了理论结果。

Jun, 2016

众包的极小化误差率分析及其在工人聚类模型中的应用

该研究针对实际的众包模型和更广泛类别的众包模型，推导出更实用的 Dawid 和 Skene 模型的最小化极差错误率，并提出了一种更实用的工人聚类模型，得到的实验结果与理论分析结果在最小极差错误率下具有较强的相似性。

Feb, 2018

基于成对共现的众包：可识别性和算法

本文提出了一个使用注释器响应的成对共现的框架，并展示了算法的实验结果，该算法在多种情况下优于现有算法。

Sep, 2019

快速 Dawid-Skene：情感分类的快速投票聚合方案

提出了一种基于 EM 算法的新的、简单且有效的标注数据聚合算法，用于实时情感标注，能够快速收敛，准确性与 Dawid-Skene 算法相当，速度约为 Dawid-Skene 算法的 8 倍。

Mar, 2018

众包的最优速率中的精确指数

本文研究了通过非专业工作者提供的标签进行聚合的最佳错误率，并在 Dawid-Skene 模型下建立了匹配的上下界和精确指数，该精确表征错误指数允许我们陈述达到 ε 比分类误差所需的精确样本大小要求，此外，我们的结果表明，各种由一致估计初始化的众包 EM 算法的最优性。

May, 2016

一种极小极大算法用于群体外包

本文提出一种名为 Triangular Estimation（TE）的算法用于估计众包工作者的可靠性，并得出了一个新的下限，该下限适用于任何估计程序。通过对合成和现实数据集的性能评估，证明 TE 的最小最大近似误差具有优越性。

Jun, 2016

众包的正则化极小极大条件熵

本文提出了一种利用极小化最大条件熵原理从嘈杂的众包标签中推断出真实标签的独特概率标记模型，该模型考虑到了工人能力和项目难度等因素，并提出了客观测量原则验证。

Mar, 2015

基于信念传播的众包分类最优推断

本文研究了在众包标注过程中，利用 Dawid-Skene 模型恢复错误标注并输出正确标注问题，提出了一种更紧密的下限和 Belief Propagation （BP）算法来解决这一问题。实验结果表明，BP 是所有算法中最优的。

Feb, 2016