本研究提出了一种用于多类众包标注问题的两阶段高效算法,第一阶段使用谱方法获取参数的初始估计,然后第二阶段通过 EM 算法优化 Dawid-Skene 估计器的目标函数来进一步细化估计,实验结果表明该算法具有最优收敛速率。
Jun, 2014
本文提出了一种基于谱方法的标签聚类算法,从而在众包任务中提高 Dawid-Skene 模型推理个体正确标签的准确度。
Feb, 2023
本文提出一种排列模型 - 用于聚合和去噪众包标注数据,该模型是对经典的 Dawid-Skene 模型的重要推广,并介绍了一种新的误差度量方法,用于比较不同的估计器。我们设计了两种计算有效的估计器:WAN 估计器和 OBI-WAN 估计器,并对它们的性能进行了非渐近界限的界定。最后通过合成模拟和实验数据验证了理论结果。
Jun, 2016
该研究针对实际的众包模型和更广泛类别的众包模型,推导出更实用的 Dawid 和 Skene 模型的最小化极差错误率,并提出了一种更实用的工人聚类模型,得到的实验结果与理论分析结果在最小极差错误率下具有较强的相似性。
Feb, 2018
本文提出了一个使用注释器响应的成对共现的框架,并展示了算法的实验结果,该算法在多种情况下优于现有算法。
Sep, 2019
提出了一种基于 EM 算法的新的、简单且有效的标注数据聚合算法,用于实时情感标注,能够快速收敛,准确性与 Dawid-Skene 算法相当,速度约为 Dawid-Skene 算法的 8 倍。
Mar, 2018
本文研究了通过非专业工作者提供的标签进行聚合的最佳错误率,并在 Dawid-Skene 模型下建立了匹配的上下界和精确指数,该精确表征错误指数允许我们陈述达到 ε 比分类误差所需的精确样本大小要求,此外,我们的结果表明,各种由一致估计初始化的众包 EM 算法的最优性。
May, 2016
本文提出一种名为 Triangular Estimation(TE)的算法用于估计众包工作者的可靠性,并得出了一个新的下限,该下限适用于任何估计程序。通过对合成和现实数据集的性能评估,证明 TE 的最小最大近似误差具有优越性。
本文提出了一种利用极小化最大条件熵原理从嘈杂的众包标签中推断出真实标签的独特概率标记模型,该模型考虑到了工人能力和项目难度等因素,并提出了客观测量原则验证。
Mar, 2015
本文研究了在众包标注过程中,利用 Dawid-Skene 模型恢复错误标注并输出正确标注问题,提出了一种更紧密的下限和 Belief Propagation (BP) 算法来解决这一问题。实验结果表明,BP 是所有算法中最优的。
Feb, 2016