一种可证明改进的众包算法,适用于难和易任务
本研究提出了一种用于多类众包标注问题的两阶段高效算法,第一阶段使用谱方法获取参数的初始估计,然后第二阶段通过 EM 算法优化 Dawid-Skene 估计器的目标函数来进一步细化估计,实验结果表明该算法具有最优收敛速率。
Jun, 2014
本文证明了 Dawid-Skene 估计器的投影 EM 算法收敛速率的最优性,并通过一个比较研究与多数投票相比,展示了 Dawid-Skene 估计器的优势与局限性。
Oct, 2013
本文考虑众包任务分配中的可靠性问题,提出了一种基于置信传播和低秩矩阵逼近的算法来决定如何分配任务,并从工人的答案中推断出正确答案。比较了不同算法的表现,发现基于者非自适应的算法是最优的。此外,还强调了建立可靠的工人信誉系统对于完全运用自适应设计的潜力至关重要。
Oct, 2011
本文提出一种排列模型 - 用于聚合和去噪众包标注数据,该模型是对经典的 Dawid-Skene 模型的重要推广,并介绍了一种新的误差度量方法,用于比较不同的估计器。我们设计了两种计算有效的估计器:WAN 估计器和 OBI-WAN 估计器,并对它们的性能进行了非渐近界限的界定。最后通过合成模拟和实验数据验证了理论结果。
Jun, 2016
提出一种新的算法来联合建模标签和工作者质量,从带有噪声的众包数据中学习,可优化有限的标注资源,解决如何从噪声工作者中学习以及如何分配标注预算来最大化分类器性能等问题。
Dec, 2017
通过信息论速率失真框架对人在循环计算问题进行建模和分析,以确定通过任何形式的查询和任何解码算法的结果和给定预算所能达到的最终保真度。此外,该论文还介绍并分析了一种查询方案,称为 $k$ -ary incidence coding,并研究了该场景下的查询定价。
Aug, 2016
本文探讨半监督众包分类在标签约束和实例约束两种情况下的贝叶斯算法,该算法基于变分推断,可以比无监督众包分类更有效地对人工注释信息进行聚合,该算法在多个众包数据集上的分析和实证验证了其表现的可量化提升。
Dec, 2020